├── .gitignore
├── Gemfile
├── Makefile
├── README.md
├── Rakefile
├── TODO.md
├── VERSION
├── atomic-write.re
├── basic-design.re
├── catalog.yml
├── cfp.re
├── conclusion.re
├── concurrency-control.re
├── config.yml
├── data.re
├── doc
    ├── catalog.ja.md
    ├── catalog.md
    ├── customize_epub.ja.md
    ├── customize_epub.md
    ├── format.ja.md
    ├── format.md
    ├── format_idg.ja.md
    ├── makeindex.ja.md
    ├── makeindex.md
    ├── pdfmaker.ja.md
    ├── pdfmaker.md
    ├── preproc.ja.md
    ├── preproc.md
    ├── quickstart.ja.md
    ├── quickstart.md
    ├── writing_vertical.ja.md
    └── writing_vertical.md
├── file-io.re
├── images
    └── cover.jpg
├── indexes.re
├── lib
    └── tasks
    │   └── review.rake
├── locale.yml
├── memo.re
├── next-step.re
├── preface.re
├── sty
    ├── README.md
    ├── gentombow.sty
    ├── jsbook.cls
    ├── jumoline.sty
    ├── plistings.sty
    ├── review-base.sty
    ├── review-custom.sty
    ├── review-jsbook.cls
    ├── review-style.sty
    ├── review-tcbox.sty
    └── reviewmacro.sty
├── style.css
├── transaction.re
└── wal.re


/.gitignore:
--------------------------------------------------------------------------------
1 | *~
2 | book.pdf
3 | *.html
4 | version_str.txt
5 | book-pdf/
6 | 


--------------------------------------------------------------------------------
/Gemfile:
--------------------------------------------------------------------------------
1 | source 'https://rubygems.org'
2 | 
3 | gem 'rake'
4 | gem 'review', '2.5.0'
5 | 


--------------------------------------------------------------------------------
/Makefile:
--------------------------------------------------------------------------------
 1 | .PHONY: build clean rebuild
 2 | 
 3 | build: book.pdf version_str.txt
 4 | 	cp -a book.pdf develop-transaction-system-v$$(cat version_str.txt).pdf
 5 | 
 6 | version_str.txt: VERSION
 7 | 	cat VERSION |sed -e 's/\./_/g' > $@
 8 | 
 9 | book.pdf: *.re *.yml
10 | 	rake pdf
11 | 
12 | clean:
13 | 	rm -f book.pdf
14 | 
15 | rebuild:
16 | 	$(MAKE) clean
17 | 	$(MAKE) build
18 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | # データベース自作入門
 2 | 
 3 | これは「データベース自作入門」本のソースコードです。
 4 | フィードバック大歓迎です。Issue にでも登録してください。
 5 | 
 6 | ## 著作権
 7 | 
 8 | (C) 2018 Takashi HOSHINO
 9 | 
10 | ## ライセンス
11 | 
12 | [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)
13 | 
14 | ## ビルド
15 | 
16 | 2022 年 8 月現在、[Re:VIEW](https://github.com/kmuto/review) 5.5 でビルドできます。
17 | LaTeX 経由で PDF が生成できることしか確認していません。
18 | 
19 | -----
20 | 


--------------------------------------------------------------------------------
/Rakefile:
--------------------------------------------------------------------------------
1 | Dir.glob('lib/tasks/*.rake').sort.each do |file|
2 |   load(file)
3 | end
4 | 


--------------------------------------------------------------------------------
/TODO.md:
--------------------------------------------------------------------------------
1 | # TODO
2 | 
3 | - はじめに、に「トランザクションとは〜」という説明を追加する。
4 | - ベンチマークのコラムをメモに書く。
5 |   - tpcc-runner を紹介する。
6 | 
7 | 


--------------------------------------------------------------------------------
/VERSION:
--------------------------------------------------------------------------------
1 | 1.0
2 | 


--------------------------------------------------------------------------------
/atomic-write.re:
--------------------------------------------------------------------------------
  1 | = Atomic な永続化方法
  2 | 
  3 | 
  4 | ファイルに対する @<tt>{write()} システムコールで書いたデータの永続化は @<tt>{fsync()} か @<tt>{fdatasync()} を、
  5 | Mmap されたファイルの変更データの永続化は @<tt>{msync()} を使えば良いのでした。
  6 | 基本的な永続化の操作はこれだけしかないのですが、もう少し高い抽象度から見た操作として、
  7 | Atomic に書き込みを永続化するにはどうすれば良いかについて考えていきましょう。
  8 | 具体的には、以下のそれぞれの場合について説明します。
  9 | 
 10 | 
 11 |  * Atomic にファイルに追記したい場合
 12 |  * Atomic にファイルまるごと上書きしたい場合
 13 |  * Atomic にファイルの一部を上書きしたい場合
 14 |  * Copy-on-Write (CoW)
 15 |  * その他
 16 | 
 17 | 
 18 | == Atomic にファイルに追記したい場合
 19 | 
 20 | この方法は追記ファイルである WAL ファイルの Atomic 書き込みに使えます。
 21 | 前提として、データを書きたい場所、すなわちファイル内のオフセットは分かっているものとします。
 22 | それまでも同様に Atomic に追記しているのであれば、ファイルの終端オフセットは分かるはずなので、
 23 | それがこれから追記するデータの先頭オフセットとなります。
 24 | 
 25 | まずは、書きたいデータの Checksum を計算します。アルゴリズムは @<tt>{crc32} など好きなものを選んでください。
 26 | ただし、アルゴリズムの特性を良く理解してから選びましょう。
 27 | 今回必要になる Checksum の性質で一番重視すべきものは、Hash 関数として捉えたときの衝突耐性です。
 28 | 不完全なデータなのに完全だと誤判定されてしまう事象が発生する確率が無視できない状況では、
 29 | データを正しく Atomic に書ける、という性質を担保するのが難しくなります。
 30 | 
 31 | データを実際に書くときは、Checksum、データサイズ、データの中身を書き、永続化保証が必要なら直後に永続化命令を発行します。
 32 | Checksum は典型的には固定サイズですが、そうでない場合は Checksum データの終端が分かるようにします。
 33 | データサイズも同様です。例えば 64bit little endian unsigned integer を使うのであれば、8 bytes 固定です。
 34 | このフォーマットは一例ですが、それぞれのデータの位置が後で分かるようになっていることが必要です。
 35 | データサイズが固定長である場合は、あえて毎回データサイズを記録しなくても良いでしょう。
 36 | 可変長のデータについては、別途固定長のサイズ情報を記録することで、区切りが分かるというわけです。
 37 | C 言語の文字列のように、区切り文字を使うケースもありますが、
 38 | データに区切り文字そのものを格納できないという制約があったり、
 39 | 頑張って格納しようとするとエスケープ処理が必要だったり、
 40 | 前から順番に読まないと区切りが分からないというデメリットがありますので、
 41 | データを永続ストレージに格納するという文脈では多くの場合
 42 | サイズ情報を別途記録する方が良いと考えられます。
 43 | 特にエスケープ処理はセキュリティの穴が空きやすいので原則使わないようにしましょう。
 44 | 
 45 | Crash recovery するときには、まず Checksum とデータサイズをメモリに読み込みます。
 46 | これで、データサイズが分かる(データサイズそのものが正しいかどうかはこの時点でまだ分からないので、
 47 | 値が大きすぎるなど、仕様に反するときは何らかのエラー処理を行う必要があるかも知れません)。
 48 | 次に、データの中身をメモリに読み込み、Checksum を再計算し、記録されているものと一致すれば、
 49 | それは正しく完全に書かれたデータだと信じられます。
 50 | Checksum が不一致ならば、データは不完全と判断します。
 51 | 
 52 | 「完全なデータが書かれているならば Checksum が一致する」という命題は真です。
 53 | しかしその逆である、「Checksum が一致するならば完全なデータが書かれている」という命題は
 54 | 必ずしも真ではありません。だから、信じると書きました。
 55 | 完全なデータではないのに Checksum が偶然一致してしまった、
 56 | という稀な事象が起きていないと信じているということです。
 57 | このリスクを少しでも減らすためには、Checksum アルゴリズムの選定に気をつかうだけでなく、
 58 | Checksum が一致したとされるデータが
 59 | (DBMS レベルで、さらにはアプリケーションレベルで)正しいかどうかを確認するのが
 60 | 良いでしょう。
 61 | 
 62 | 
 63 | 
 64 | == Atomic にファイルをまるごと上書きしたい場合
 65 | 
 66 | 設定ファイルなどを更新するときに、ファイルをまるごと Atomic に変更したいときがあります。
 67 | ファイルを読む人は、Open したときのファイル内容を一貫して読めます。
 68 | これは大きなファイルでも使えるテクニックですが、
 69 | ファイル内容の変更量が少ない場合は無駄が多いデメリットとなりますので注意が必要です。
 70 | 
 71 | まず対象と同一ディレクトリ内に Temporary な名前で新規ファイルを作成し、新しい中身を書き込み、永続化します。
 72 | 同一ディレクトリでなくても構いませんが同じファイルシステムに属する場所でないと
 73 | 次の Rename 操作が失敗するので注意してください。
 74 | 次に、@<tt>{rename()} システムコールを使って名前を対象のものに変えます(上書きします)。
 75 | @<tt>{rename()} は Atomic 動作が保証されており、@<tt>{rename()} の前後で対象ファイルを Open した人は、
 76 | 古いファイル内容か、新しいファイル内容のどちらかを必ず見ることになります。
 77 | 古いファイル内容は、それを Open している人がいなくなった後に削除されます。
 78 | Rename 前の永続化は必須なので、注意してください。この永続化をサボる人が多すぎるらしく、
 79 | サボっててもちゃんと動くようお節介をしてくれるファイルシステムもあるようです
 80 | (ext4 の @<tt>{auto_da_alloc} オプション参照)。
 81 | 
 82 | Rename の結果を永続化するには、新しいファイルに対してさらなる @<tt>{fsync} の実行が必要です。
 83 | 以前は @<tt>{rename()} によるファイルメタデータの変更を永続化するために
 84 | 対応するディレクトリエントリを永続化する必要があるという話がありましたが、
 85 | @<tt>{ext4} など最近のファイルシステムでは対象ファイルの @<tt>{fsync} で良さそうです@<fn>{footnote_rename}。
 86 | 
 87 |  * 参考(1): @<href>{http://d.hatena.ne.jp/kazuhooku/20100202/1265106190}
 88 |  * 参考(2): @<href>{http://blog.gachapin-sensei.com/archives/618823.html}
 89 | 
 90 | //footnote[footnote_rename][Linux 5.17 ext4 (ordered) で私が動作を確認した限りでは、Rename 後の永続化操作は、親ディレクトリに対する @<tt>{fdatasync} をするのでも新しいファイルに対する @<tt>{fsync} をするのでもどちらでも構わないようです。ただ、異なるファイルシステムや異なる OS では挙動が異なるかも知れませんので十分注意してください。]
 91 | 
 92 | 
 93 | == Atomic にファイルの一部を上書きしたい場合
 94 | 
 95 | MySQL などでは Double write という手段が使われています。
 96 | Double write buffer という専用のファイルを用意し、そこにまず書いて永続化してから、
 97 | 本体ファイルを上書きし、最後に Double write buffer から消します。
 98 | Double write buffer に書くときは Atomic に追記するテクニックを使います。
 99 | Crash recovery 時に Double write buffer に残っているデータは
100 | 本体ファイルにおいて中途半端に書かれている可能性があるので、
101 | 本体ファイルの上書き操作を再実行することで Atomic 性を担保します。
102 | 
103 | Double write buffer は WAL における Redo log と似た働きをすると思って良いでしょう。
104 | WAL を使っているシステムの場合、WAL ファイルにログとして上書きしたいイメージを追記することで、
105 | Crash recovery 時に上書き操作を Redo することで Atomic 性を担保できます。
106 | 毎回 WAL などに書くとログファイルが膨れあがってしまうので、
107 | Checkpoint 後に初めて上書きする場合などに限るなどの最適化が行われます。
108 | この方式は PostgreSQL で採用されています。
109 | 
110 | 典型的なブロックストレージでは Block ひとつの書き込みについては Atomic 性を持っています。
111 | ファイルシステムが何か特別なことをしていない限り、昨今の Linux では 4KiB sector HDD が存在するので、
112 | 実体としての Atomic write 単位が 512B だったり 4KiB だったりしますが、小さい方に合わせて、
113 | 512B Alignment された領域に 512B の @<tt>{write()} システムコールを 1 回のみ用いた書き込みであれば、
114 | Atomic に書かれるとみなして良いです。
115 | HDD に限らず Flash memory で作られたブロックストレージも、この性質を満たすように作られているはずです。
116 | Linux のファイルシステムのスーパーブロックの書き込みはこの性質を仮定しています。
117 | これはシステム依存の挙動であることに十分注意してください。
118 | あなたがシステム全てをコントロールできる立場にあり、特定の書き込みが Atomic に書かれることが確信できるなら
119 | ご自分の責任でそれに依存した設計をしても構いません。
120 | それを信じることができない環境では、Atomic 追記のテクニックを使う必要があります。
121 | 
122 | 
123 | 
124 | == Copy-on-Write (CoW)
125 | 
126 | 上書きするときにコピーする、という名前通りの手法です。
127 | CoW という言葉を使うときは、メモリ断片とそれを指すポインタ(ポインタは Atomic に書き換えられることが前提)の話と、
128 | ディスク上で Tree 構造を扱うときの話があるように思います。今回は後者の話です。
129 | Tree ノードの一部を上書きしたいとき(通常は Leaf ノード)、新しいノードを確保し、
130 | ノードの中身をまるごとコピーして、必要な変更を新しいノードに加えます。
131 | 新しい変更は Atomic に実行する必要はありません。新しいノードはまだ Root ノードから辿れない状態なので。
132 | ノードの位置情報を参照しているノード上で書き換える必要がありますが、
133 | その書き換えが Atomic に出来るならそうして終わりです。
134 | Atomic に書き換えできない場合は、同様に位置情報を書き換えたノードのコピーを作って……という操作を
135 | 再帰的に繰り返します。
136 | すると、いずれ一番上の Root ノードに到達します。
137 | Root ノードが Atomic に書けるならそれを Atomic に書き換えて終わりですが、
138 | そうでないなら、Root ノードの変更されたコピーを用意して、
139 | 新しい Root ノードの位置情報を、
140 | 何らかの方法でその Tree 全体を管理するデータ(Root の位置情報が記録されている場所) を Atomic に書き換えます。
141 | CoW のメリットは、WAL が不要な点と、(Root ノードまで CoW する場合に)自動的に過去の Snapshot が作られる点です。
142 | (Root ノードまで CoW する場合の)デメリットは、Tree の深さと同じ数のノードの CoW を実行する必要がある点です。
143 | 
144 | 
145 | == その他
146 | 
147 | データの Atomic な永続化方法は他にもあるかも知れません。
148 | 興味があれば是非探求してみてください。
149 | Atomic な操作はそのシステムで用意されている何らかの Atomic なプリミティブ操作に依存して
150 | 構築されますので、プリミティブが何かについて意識することが大切です。
151 | 例えば、NVRAM はブロックデバイスと異なり、もっと細かい単位で永続化ができるようなので、
152 | よりきめこまかな方法で目的を達成できる可能性があります。
153 | 例えば、分散システムではたとえディスクに永続化しなくても、
154 | 複数ノードにコピーが存在する事実をもって永続化相当とみなせるかも知れません。
155 | 何を前提とできるかは環境によって異なり、またそれが未来永劫不変の性質であるとみなせるわけでもありません。
156 | DBMS も含め、ソフトウェアは環境に合わせて変化する必要があります。
157 | Atomic な永続化手法についても、例外ではありません。
158 | 


--------------------------------------------------------------------------------
/basic-design.re:
--------------------------------------------------------------------------------
  1 | = DBMS を学ぶためのリファレンス設計 基本
  2 | 
  3 | 
  4 | これまで、トランザクションを処理を目的とした DBMS が備えているべき
  5 | 機能や性質について個別に説明してきました。
  6 | では、全体としてどんな機能があればトランザクション処理できると言えるでしょうか。
  7 | 本章では、トランザクション処理ができるといえる最小限の機能セットについて考えます。
  8 | 習うより慣れろの精神で、作ってみよう、という人はこれを読んで
  9 | 実際に動くプログラムとしての DBMS を作ってみてください。
 10 | 
 11 | 
 12 | 
 13 | == 並行実行制御
 14 | 
 15 | 並行実行制御は、今なおより良いものを求めて研究が行われている奥深いテーマですが、
 16 | 必要最小限のトランザクション処理システムに必要か、と言われると、
 17 | なくても成立すると思いますので、ここでは涙を飲んでバッサリ削ろうと思います。
 18 | 並行実行制御をせずに、きちんと動かす、すなわち Serializable に実行するためにはどうするか。
 19 | そうです、本当に Serial (直列)実行をすれば良いのです。
 20 | 直列実行するスケジューラを Trivial scheduler といいます。
 21 | また、データ構造の排他は大変で、設計と実装の難易度が上がりますので、
 22 | 思いきってシングルスレッドで動かす DBMS を作ることにしましょう。
 23 | 
 24 | ということで皆さんはまずシングルスレッドで動くトランザクション処理システムを
 25 | 作ることを目標にしてもらおうと思います。
 26 | Trivial scheduler には並行実行制御は不要なので、
 27 | インデクスと WAL 機能があれば最小限の DBMS ができることになります。
 28 | 
 29 | 
 30 | 
 31 | == インデクスとスキーマ
 32 | 
 33 | インデクスを実現するデータ構造について、Tree map と Hash table を紹介しました。
 34 | より単純な DBMS は、どちらかのみサポートしているでしょう。
 35 | Tree map なら Range query が出来ますから、Phantom problem やその対処に興味がある人は
 36 | Tree map を選びましょう。そのような事情がない人は、Hash table でも良いでしょう。
 37 | 極端な例を挙げると、インデクスを使わずに Record の配列を使っても良い、と主張する
 38 | 人がいるかも知れません。Table full scan はできますね……
 39 | ただ、お目当ての Record に低コストでアクセスできる機能はさすがに必須としたいなと私は思います。
 40 | 
 41 | メモリ上とディスク上のデータフォーマットを無理に共通化したくありませんし、
 42 | ページ単位で Atomic に書いたりするのは面倒そうですし、何よりバッファキャッシュ管理をしたくない
 43 | (本書でも説明していません！！！）ので、
 44 | インメモリ DBMS を作ることにしましょう。
 45 | メモリに格納できない大きなデータベースは扱わないという割り切りをします。
 46 | これで、メモリ上でインデクスを実装すれば良くなりました。
 47 | シングルスレッド前提なので、排他制御も不要です。
 48 | あれれ、多くのプログラミング言語ではほぼ標準ライブラリで
 49 | この要件を満たす Tree map や Hash table を用意しているようですよ。
 50 | それらのライブラリを使えばインデクスが何故高速か、そのメカニズムを知らなくても
 51 | インデクスを実装できてしまいます。
 52 | 私としては学びのために自分でインデクス構造を実装することも検討して欲しいのですが、
 53 | 最小限、という意味ではサボって構いません。
 54 | 
 55 | DDL (Data definition language) 等を用意すると手間なので、
 56 | 設定ファイルを読み込む形で定義させるか、もっと簡単に作るために、
 57 | ハードコーディングしてしまいましょう。
 58 | 動的なスキーマ変更もサポートしないこととします。
 59 | 極端なことをいえば、テーブルはひとつあれば十分じゃないでしょうか。
 60 | 
 61 | Record の仕様を決めましょう。
 62 | もちろん、たくさんの Primitive 型を用意して、任意の Column を組み合わせて Record を定義できると便利ですね。
 63 | しかし、設計と実装を簡単にするために、サボりましょう。
 64 | 巷の Key-value store と呼ばれるものには、Key 型も Value 型もバイト列型しか選べないものもあるようです。
 65 | バイト列は表示するときに面倒なので、いっそ文字列に限定してしまいましょうか。
 66 | 文字列も、ユニコードだのなんだのは面倒くさいので、ASII 文字だけに限定してしまいましょうか。
 67 | 
 68 | リッチなスキーマを想定するのであれば、セカンダリインデクスは欲しくなりますが、
 69 | Key-value store なら、プライマリインデクスだけあれば良いでしょう。
 70 | 必要になったとしても、同じデータ構造を流用すれば良いので、
 71 | セカンダリインデクスは比較的簡単に実装できると思います。
 72 | 
 73 | 
 74 | == Write-ahead Logging
 75 | 
 76 | インメモリ DBMS とはいっても、ACID property を満たすために永続化はしないといけません。
 77 | ログ先行書き込み (WAL) 機能は Commit 条件を満たすために実装する必要があります。
 78 | ログファイルのフォーマットを決めましょう。
 79 | DBMS がどんなデータ操作をサポートするかを決めて、
 80 | そのオペレーションの Redo log の仕様を決めます。
 81 | SQL と似たようなインターフェースを想定するのであれば、
 82 | Update/insert/delete の三種類をサポートすることになります。
 83 | もっと簡単にしたいなら、Put (Upsert) のみサポートするのもありでしょう。
 84 | Upsert とは、その Primary key を持つ Record が存在していなければ Insert、
 85 | 存在していたら Update する、という操作です。
 86 | 
 87 | Redo/undo log のどれを採用するかについて考えましょう。
 88 | Trivial scheduler を使う場合、トランザクションロジックによる明示的な Abort 命令と
 89 | Crash による Abort 以外では Abort しませんので、比較的簡単に実装できる Redo log のみを使う設計をオススメします。
 90 | 
 91 | そのトランザクションを Commit するぞと決めるまで、
 92 | メモリ上のデータベース本体に変更を反映しないようにすれば、Undo log は不要です。
 93 | Redo log は 後述する Write set から作れます。
 94 | Redo log は Atomic に書きましょう。Atomic に書く単位について、
 95 | オペレーション単位で書くか、トランザクション単位で書くか、これも設計上の選択肢です。
 96 | 
 97 | 
 98 | == Read set と Write set
 99 | 
100 | DBMS 側のトランザクション実行エンジンはどのように振る舞えば良いでしょうか。
101 | 本書は Non-deterministic DBMS を想定すると言いましたね。
102 | 実行エンジンは次にどんな命令が来るのか分からないのでトランザクションの状態管理をする必要があります。
103 | 
104 | 同じ Record に対する複数回のアクセスをうまく吸収するための仕組みとして Read set と Write set があります。
105 | Read set はトランザクションが過去に読んだ Record の参照とその内容を保持しておきます。
106 | Write set はトランザクションが書いた内容で、やはり Record の参照とともに保持しておきます。
107 | Trivial scheduler を採用するとき Read set は不要です。なぜなら自分以外にトランザクションは
108 | 並行に実行されていないので、同じ Record を何回読んでも自分が変更しない限り同じだからです。
109 | 
110 | Trivial scheduler を採用していても Write set は必要です。
111 | 何故なら Redo log のみ記録する設計を選んだからです。
112 | いついかなるときでも Undo はできないので、Undo が不要になることが確定するまで
113 | データベース本体に変更を反映してはいけません。
114 | Undo が不要になる瞬間は、Commit することが確実視されたときです。
115 | 一般には、CC protocol がそのトランザクションを Commit させると決定(Commit しても良いと判断)したときですが、
116 | Trivial scheduler においてその判断は不要なので、Commit 命令を受けとった瞬間が対応します。
117 | もしそれより前にデータベース本体に変更を反映してしまい、
118 | その後トランザクションロジックから Abort 命令が来たら、Undo できなくて詰みます。
119 | トランザクション実行中はデータベース本体と Write set を別々に管理しますが、
120 | トランザクションロジックから見ると、
121 | あたかもそれまでの変更がデータベース本体に反映されているかのように振る舞います。
122 | すなわち、Write set に存在する Record の Read 要求に対しては Write set に保持されている内容を返すということです。
123 | 別の見方をすれば Write set はキャッシュデータとして振る舞います。
124 | Write set はトランザクションによるデータベース変更への変更データそのものなので、
125 | Write set から Redo log が作れます。自分で決めたフォーマットに従って変換するだけです。
126 | 
127 | 
128 | 
129 | == Crash recovery
130 | 
131 | DBMS 起動時にやるべきことは、Crash recovery です。
132 | Crash recovery は、Commit の返事をした(および Commit だと判定した)全てのトランザクションの実行結果が
133 | 反映されたデータベース状態をメモリ上に再構築し、新規トランザクションを受けつけられる状態にすることです。
134 | 前回の Checkpointing 時のデータベースファイルがあればメモリに読み出し、
135 | WAL ファイルの中身を Redo してメモリ上に正しいデータベース状態を再構築します。
136 | このとき、同じログを複数回適用するハメになるかもしれないことに気をつけてください。
137 | 典型的には、同じログを何回適用しても大丈夫なように作る必要があります。
138 | もしくは、二回目以降はスキップできるような仕組みを用意する必要があります。どちらにするか、
139 | それも設計の選択肢です。
140 | 
141 | 
142 | == Checkpointing
143 | 
144 | Checkpointing は出来るだけ簡単なものにしたいので、
145 | トランザクションが動いていないときのみ、いやいやもっと極端に起動時のみにやることにしましょう。
146 | 起動時、Crash recovery 直後は、メモリ上には正しいデータベース状態がありますが、
147 | その直後にまた Crash したら、せっかく Crash recovery したのに同じことをやりなおす必要があります。
148 | そこで、今再構築したばかりのデータベース状態を、Snapshot としてファイルとして
149 | 書き出して永続化してあげましょう。これを Dump 操作といいます@<fn>{footnote_load}。
150 | 永続化が完了したら、次の Crash recovery はこの Snapshot から始めればよいので、
151 | 今ある WAL ファイルの中身はもう必要ありませんので、消してしまいましょう。
152 | それぞれの操作について、永続化も含めて順番には気をつけましょう。
153 | いついかなるときに Crash するか分かりませんから、常に備える必要があります。
154 | これが一番ナイーブですが一番簡単な Checkpointing だと思います。
155 | また、Dump 操作においては、Atomic にファイル全体を書くことを忘れないようにしましょう。
156 | 
157 | //footnote[footnote_load][Crash recovery で必要とした、Snapshot ファイルをメモリに読み込む操作を Load と呼びます。Dump/load はお互いに逆の操作なのでセットで考えます。]
158 | 
159 | 
160 | == トランザクションとワークロード
161 | 
162 | Read/insert/update/delete (もしくは Get/put)、そして Commit/abort を実行する API を用意して、
163 | 簡単な動作確認をするためのトランザクションを実装してください。
164 | トランザクションロジックが呼び出すデータベース操作 API はライブラリとして実装しましょう。
165 | ネットワークなどを介した専用プロトコルを用意するより簡単です。
166 | それを組み込み DBMS というのでしたね。
167 | トランザクションやそれを呼び出すワークロードも同じプログラミング言語で書いて DBMS 実装に
168 | 組み込んでしまいましょう。
169 | とはいえ、たとえコンパイルで同一バイナリになるとしても、
170 | インターフェースをきちんと定義して境界を意識して設計実装してください。
171 | DBMS が起動し、初期化が終わってトランザクションを受けつけられる状態になったら、
172 | トランザクションを有限個または無限個実行するような
173 | コード(ワークロード実装)を用意しておいて動かしてみてください。
174 | 
175 | Crash test がしたい場合は、外部から強制的に DBMS が動いているホストを落とすとき、
176 | トランザクションが実行中であるようにしておく必要がありますね。
177 | 性能測定がしたい場合は、時間を測ったり実行できたトランザクションの個数を数えたり
178 | するコードもアプリケーションとして一緒に書いてしまいましょう。
179 | 
180 | 
181 | == 作って動かしてみる
182 | 
183 | 
184 | 以上で、大体のアーキテクチャは固まってきました。
185 | 細かいところは自分で考えてみてください。また、ご自分の興味に従って設計を変更しても大丈夫です。
186 | 
187 | まずは出来るだけ簡単だけど、動くものを作ることが学びのモチベーション維持のためにも大切です。
188 | だから本章は最小限の設計を指針としています。
189 | 出来るだけ少なくて簡単な要件から始めましょう。
190 | そして、要件を満たす仕様を考えていきます。
191 | そして、仕様に沿って実装して動かしてみましょう。
192 | 要件、仕様、そして実装をいったりきたりすると思います。これが出戻りというやつですが、
193 | 大いにいったりきたりしましょう。やってみないと分からないことはあるものです。
194 | トランザクションシステムは、特に設計の選択肢が多いと思います。
195 | どんな選択をすれば、どんなメリットやデメリットがあり、どんな制約が発生するか、
196 | 考えながら設計しましょう。
197 | どんな選択をしたか、何故そうしたか、それらを整理することを心がけてください。
198 | 人に説明できることが重要です。
199 | 本書を使って学ぶみなさんには、要件と仕様をきちんと定めていくこと、定めようとすることが
200 | ソフトウェアの品質向上にどれだけ寄与するかということも学んで欲しいと思います。
201 | @<secref>{memo|sec-requirements-and-specification}
202 | も参考にしてください。
203 | 
204 | コーディングについては、単に動けば良いというわけではなく、読みやすさに気をつけましょう。
205 | @<secref>{memo|sec-readable-code}を参考にしてください。
206 | 
207 | 
208 | 
209 | == テスト
210 | 
211 | 作ったプログラムが正しく動いていることを確認するにはテストをすることが欠かせません。
212 | 正常系として、データ操作をしたらそれが反映されているか、などの基本動作についてテストします。
213 | プロダクションで動かすことを考えていくならエラー処理(そして異常系テスト)がとても重要ですが、
214 | 学習用のプログラムなので、ある程度は目をつぶりましょう。
215 | しかし、異常系の中で DBMS としてひとつだけ絶対に押さえておかなければならないテストがあります。
216 | それが Crash test です。
217 | トランザクション実行中にマシンの電源を落として、Crash recovery できることを確認してください。
218 | Virtual Machine を使って仮想的に電源を落とすのが良いでしょう。
219 | Commit の返事をしたのに反映されていないことがないかどうか、
220 | 中途半端な状態になっていないか、データとして壊れていないかどうかを確認してください。
221 | @<secref>{memo|sec-about-test}も参考にしてください。
222 | 


--------------------------------------------------------------------------------
/catalog.yml:
--------------------------------------------------------------------------------
 1 | PREDEF:
 2 |   - preface.re
 3 | 
 4 | CHAPS:
 5 |   - data.re
 6 |   - transaction.re
 7 |   - indexes.re
 8 |   - wal.re
 9 |   - concurrency-control.re
10 |   - file-io.re
11 |   - atomic-write.re
12 |   - basic-design.re
13 |   - next-step.re
14 |   - memo.re
15 | 
16 | APPENDIX:
17 | 
18 | POSTDEF:
19 |   - conclusion.re
20 | 


--------------------------------------------------------------------------------
/cfp.re:
--------------------------------------------------------------------------------
 1 | #@# https://github.com/kmuto/review/blob/master/doc/format.ja.md
 2 | 
 3 | = セキュリティキャンプ 2018 全国大会 募集要項
 4 | 
 5 | == データベースシステムとは
 6 | 
 7 | データベースは，データの集まりで，使う人が必要に応じて検索したり，データを追加，編集，削除したり，まとめて加工集計をしたりするためのものです．
 8 | 
 9 | 独りで使うデータベースであれば，用途にもよりますが，Excel などの表計算ソフトでも足りることが多いと思います．複数人で，組織で，Web サービスで，ひとつのデータベースを管理したい場合は，もっと良い方法があります．それがデータベースシステムを使うことです．
10 | 
11 | データベースシステムといったとき，皆さんは具体的にどんなソフトウェアを思い浮べるでしょうか？オープンソースのデータベースシステムだけとっても，MySQL，PostgreSQL など，商用だと Oracle，DB2，SQL Server，Google Spannar など，たくさんあります．これらは SQL という操作インターフェースを供えており，トランザクション処理が可能です．また，大量のデータを加工，集計する処理も，規模や状況によりますが可能です．
12 | 
13 | もう少し広い範囲でも見てみることにします．
14 | 
15 | Hadoop や Spark などは，細かい単位でのデータ操作，とりわけトランザクション処理には対応していない代わりに，SQL でいうところの SELECT 文の実行，つまり，データを大量に加工，集計する用途に特化しています．また，ひとつのホストでは保持できない程の大量のデータを扱えるように，複数のホストをまたがって動作する分散システムです．
16 | etcd などは，設定情報を分散システムで安全に共有する目的で使われることが多いデータベースシステムです．Key-value store という分類をされ，ソフトウェアによって違いはありますが，主に key を指定して，value を検索，操作する，
17 | SQL と比べてより単純なインターフェースを持っています．
18 | 同様の key-value store として，memcached や Redis などは，データの永続化をある程度犠牲にしてでも，高速に処理したいデータを扱う目的で使われることが多いようです．
19 | 
20 | 以上のように，目的，用途に応じて様々なデータベースシステムがあります．
21 | 
22 | 
23 | == トランザクション処理
24 | 
25 | 本ゼミは，上記で紹介した様々なデータベースシステムが持っている機能の中で，トランザクション処理を対象とします．トランザクション処理は，世の中になくてはならない処理のひとつです．皆さん(のご両親)が銀行 ATM でお金を入出金したり，送金したりする度に，裏でトランザクションが実行されます．ATM での操作が「きちんと」実行されないと困りますよね．また，皆さん(のご両親)がインターネット上の販売サイトで何かを購入するときに，決済(支払い)の画面で，決済ボタンを押す度に，裏でトランザクションが実行されます．これらの操作も「きちんと」処理してくれないと困りますよね．お金のやりとりにはほぼ必須ですが，それに限らず様々なやりとりでトランザクション処理は必要とされています．世の中には「きちんと」処理してくれないと困る処理が多いからです．「きちんと」がどういう意味を持つかについて理解するには，ACID の理解が必要となります．応募時の設問にもなってますので，分からない方，興味を持った方は自分で調べてみてください．
26 | 
27 | トランザクション処理の重要性についてつらつらと書きましたが，本ゼミに取り組む一番の理由は、講師である私が，トランザクション処理をおもしろい，と思っているからです．
28 | 
29 | 
30 | == トランザクション処理を学ぶべき人
31 | 
32 | アルゴリズムとデータ構造を学ぶのがおもしろいと思う方は，トランザクション処理もおもしろいと感じる適性が間違いなくあると思います．何故ならトランザクション処理は，メモリ上，ディスク上で，様々なデータ構造を必要とし，その操作に伴うアルゴリズムを必要とするからです．
33 | 並列プログラミングが大好きな人も，トランザクション処理の性能を高めるために，それを駆使する必要があるので，楽しいと思います．
34 | 
35 | 
36 | == データベースゼミの目的
37 | 
38 | 本ゼミを通じて、データベースシステムの仕組みを理解し、作る側の人間になれる人を増やしたいと思っています。
39 | 
40 | セキュリティという観点では、SQL インジェクションはトピックのひとつかと思いますが、本ゼミでは SQL を扱いません。SQL はデータベースシステムを操作するインターフェースのひとつ(デファクトスタンダードではあります)でしかありません．
41 | 
42 | SQL についての情報はたくさんあります．本もたくさん出ています．それはデータベースシステムを使う人のための知識で，データベースシステムを使う人はたくさんいるからです．
43 | また，アプリケーションを設計実装する人達は，一般に，単に良い性質を持つ一連のデータベース操作としてトランザクションを設計するだけで済むことが多いと思います．
44 | それほどトランザクションという概念のもたらす抽象化は良く出来ていると思います．トランザクションは万能である一方，その皺寄せはトランザクション処理を実行するデータベースシステムの方に来ているのです．
45 | データベースシステムを作れるであろう人は，私が思うに少ないです．もちろん，使う人ほど多くなくていいですが，作る人がもっといて欲しいなと思います．さらに，データベースの作り方を教える人も少ないと思います．というわけで，微力ではありますが多少の心得がある私が本ゼミを担当することになり，応募を検討されている皆さんに向けてこの文章を書いているというわけです．
46 | 
47 | 
48 | == データベースゼミで学んでもらうこと
49 | 
50 | 本ゼミでは，トランザクションを処理する仕組みについて開発を通じて学んでもらいます．
51 | 
52 | トランザクションを実行するのに必要な主な仕組みは，メモリ上およびディスク上のデータ構造に加えて，ログ先行書き込み (Write-ahead logging, WAL) と並行実行制御(Concurrency Control) です．
53 | 
54 | 私がおもしろく，そして難しいと思うところは，トランザクションを並列に実行するための，様々な仕組みです．Concurrency Control がまずそれにあたります．Concurrency Control とひとくちに言っても様々な手法がありますが，S2PL という手法が基本中の基本だと思ってもらって良いと思います．ただ，Concurrency Control をデータベースシステム上で実現するにあたって，本当に複数の CPU コアを使って複数のスレッド/プロセスでトランザクションを並列に実行する場合，複数スレッド/プロセスからひとつのデータ構造にアクセスするので，並列プログラミングと言われている技術が必要になります．具体的には lock や latch などデータの適切な排他を行う仕組みが，場合によっては，lock-free だとか mutex-free と呼ばれているような技術もです．
55 | 
56 | 皆さん次第ではありますが，本ゼミに与えられた時間でそこまで到達するのは簡単ではないと思っています．そこで，並列処理にチャレンジする前に到達して欲しいマイルストーンとして，逐次プログラミングによるデータベースシステムの開発を目指して欲しいと思います．逐次プログラミングに対象を絞ったときは，初めに，ディスク，つまり永続ストレージの特性と操作について，次にデータ構造(主にアクセスメソッドとしてのインデクス)，そして WAL について学んでもらいます．ここまで来ると，クラッシュリカバリができるようになります．
57 | 次なるステップとして，逐次プログラミングでもできる Concurrency Control について学んでもらおうと思っています．これにより，ディスク IO の間に，別のトランザクションを実行できるようになります．
58 | 
59 | ここまでくると，その先に，楽しい並列プログラミングの世界が待っています．
60 | 
61 | 
62 | == 前提となる知識と経験
63 | 
64 | プログラミング言語として主に Python3 を使いますので，Python でプログラムを書いたことがない人には，ハードルが高いと思います．データベースシステムは，C/C++ などのよりメモリや CPU を直接扱いやすい言語で書いてあることが多いですし，最近ですと，golang や Java で書かれているものもあるようです．ただ、本ゼミでは，基本的な知識を学んでもらうことを目的としていますし，データベースシステムを作るために必要な知識を持っていないであろう方を対象としていますので，必ずしも高速なプログラムを作ってもらおうというわけではありません．そこで，私が思うに，おそらく多くの人が使ったことがあって，比較的簡単に扱えるであろう Python を選びました．他の言語が使いたいという方は，場合によっては認めますが，講師が用意した教材を改造するのではなく，イチから作ってもらうことになります．もちろん，それなりのプログラミング能力を持っている場合に限ります．
65 | 
66 | 知識について，基本的なアルゴリズムとデータ構造について理解していれば，足りないということはありません．Tree 構造と hash 構造の特性の違いだとか，search と sort アルゴリズムだとか．分からなければ，そのときに学べば良いです．ただ，時間の制約から，そのあたりの知識が少ない方は，本ゼミの恩恵をあまり受けられないかも知れません．
67 | 
68 | 
69 | == 応募を考えている人達へ
70 | 
71 | 皆さんには，本ゼミで学んだことを生かして，いずれ，是非オリジナルの特徴を持ったデータベースシステムの開発にチャレンジしていただきたいですし，実用的なデータベースシステムを作る側の人になって活躍して欲しいです．もちろん，データベースシステムを使う側の人になったとしても，ここで得た知識は多いに役立つでしょう．どのような仕組みになっているかを知らないで使うのと，知っていて使うのでは，大きな差が出ます．データベースシステムの気持ちを知らない人は，データベースをうまく使うことが出来ません．また，研究の分野でもまだまだ課題はたくさんあり，それらを解決に向かわせる新しい手法を探求していって欲しいとも思います．
72 | 
73 | データベースシステムは，秘密にしなければならないデータを格納することも多いので，データの漏洩や改竄をされないように厳重に守らなければなりません．その第一歩は，バグを出来るだけ少なくするような設計実装であることはいうまでもありませんが，データベースシステムそのものだけでなく，周辺環境，使う人達のことも含めて，セキュリティを十分意識して頂きたいと思います．
74 | 


--------------------------------------------------------------------------------
/conclusion.re:
--------------------------------------------------------------------------------
 1 | = おわりに
 2 | 
 3 | 本書はよくある入門書と異なり、写経用のソースコードが出てきません。
 4 | 理由はみっつあります。
 5 | ひとつ目は、当初リファレンス実装を書こう書こうと思っていたけれどついぞ書かなかったからです。
 6 | ふたつ目は、具体的なリファレンス実装があると
 7 | 自分で考えながら設計の選択肢を選んでいく楽しさを邪魔してしまうかも知れないと思うようになったからです。
 8 | みっつ目は、使うプログラミング言語すら自由に選んでもらいたいなと思うようになったからです。
 9 | @<chap>{basic-design}には設計案の概要しか書いてありません。
10 | 細かいところはどうすればいいんだ？という読者の皆さんの疑問もごもっともですが、
11 | それを自分で考えるという体験こそが私が皆さんにしてもらいたいことなのです。
12 | 
13 | 一方で、自分で考えてもらった設計やその実装について私のレビューやツッコミによるフィードバックがあることを
14 | 想定して本書は書かれていることも確かで、
15 | 自分で作ってみるだけでは片手落ちかも知れないという気持ちもあります。
16 | 残念ながら本書を読んでくださって設計実装した全ての方に私がフィードバックするのは現実的ではありません。
17 | しかし、設計選択肢のトレードオフについて、議論を通じて考察を深めてもらえれば目的は達成されると思いますので、
18 | 作ったものについての説明を聞いてくれそうな人、コードを見てくれそうな人がいたらお願いしてみてください。
19 | 
20 | また、セキュリティ・キャンプ全国大会などで本書の草稿を使って勉強して
21 | くださった先輩方の公開してくれているコードがありますので、
22 | それらを眺めて本書で足りないものを補ってもらえると助かります。
23 | 以下、GitHub レポジトリの URL を列挙します(2022 年 8 月現在、有効なリンクであることを確認しています):
24 | 
25 |  * @<href>{https://github.com/tiger19816/camp_learning}
26 |  * @<href>{https://github.com/hideh1231/database}
27 |  * @<href>{https://github.com/m1kit/mikrodb}
28 |  * @<href>{https://github.com/momohatt/seccampDB}
29 |  * @<href>{https://github.com/2lu3/SecurityCamp2019}
30 |  * @<href>{https://github.com/kawasin73/txngo}
31 |  * @<href>{https://github.com/KodaiD/seccamp_db_golang}
32 |  * @<href>{https://github.com/Mojashi/trivialDB}
33 |  * @<href>{https://github.com/yujixr/database}
34 |  * @<href>{https://github.com/kappybar/mydb}
35 |  * @<href>{https://github.com/kanade9/trivialdb}
36 |  * @<href>{https://github.com/kgtkr/tkvs}
37 |  * @<href>{https://github.com/yuki2501/yuki-rust-transaction}
38 | 
39 | 
40 | 本書を読み実践することが皆さんの糧になることを願っています。
41 | 
42 | 
43 | 
44 | 
45 | == 謝辞
46 | 
47 | セキュリティ・キャンプ全国大会の2018年〜2022年に
48 | 私が講師を勤めたデータベースゼミにおいて、
49 | 受講生の皆さんには本書の草稿を読んでもらい、
50 | 実際に@<chap>{basic-design}および@<chap>{next-step}に沿って
51 | プログラムを作りながら学んでもらいました。
52 | その過程で本書の内容についての様々なフィードバックを頂きました。
53 | 一人一人のお名前を挙げるのは控えますが、
54 | この場を借りて御礼申し上げます。
55 | 
56 | 
57 | == 著作権表示
58 | 
59 | @<b>{(C) 2018 Takashi HOSHINO}
60 | 
61 | 
62 | == ライセンス
63 | 
64 | 本書 (PDF) および本書のソースコードは、
65 | 
66 |  * @<href>{https://github.com/starpos/develop-transaction-system.git}
67 | 
68 | にて公開され、@<b>{CC BY-NC-SA 4.0} ライセンス@<fn>{footnote_cc_by_nc_sa} の元で
69 | 利用できます。
70 | 
71 | //footnote[footnote_cc_by_nc_sa][@<href>{https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja}]
72 | 
73 | 
74 | == 更新履歴
75 | 
76 |  * 2022-08-16 v1.0 公開。
77 |  * 2022-06-22 v0.4 セキュリティ・キャンプ全国大会2022向け。
78 |  * 2021-08-09 v0.3 セキュリティ・キャンプ全国大会2021向け。
79 |  * 2019-08-14 v0.2 セキュリティ・キャンプ全国大会2019と2020向け。
80 |  * 2018-08-28 v0.1 セキュリティ・キャンプ全国大会2018向け。
81 | 


--------------------------------------------------------------------------------
/concurrency-control.re:
--------------------------------------------------------------------------------
  1 | = 並行実行制御
  2 | 
  3 | 
  4 | 並行実行制御は英語では Concurrency control (CC) といいます。
  5 | 並行実行制御とは、並行/並列にトランザクションを実行することを前提として、
  6 | Isolation (ACID の I) を担保するために必要な処理です。
  7 | Isolation は独立性とか分離性などと訳されますが、
  8 | 要はトランザクション同士の実行が混ざらない性質を言います。
  9 | 混ざらないとは何かについて厳密に考え始めると、Serializability の話になります。
 10 | Serializability については後述します。
 11 | 
 12 | 並行実行制御を行う手法を CC protocol と呼びます。
 13 | CC protocol の仕事は、各トランザクションが要求する Read/write 実行の排他制御したり、
 14 | (Multi-version CC protocol の場合は)指定されたレコードのどの Version を読むかを決めたり、
 15 | Commit 処理時に Isolation が守られているかチェックをしてダメなら System abort させたりする処理などです。
 16 | 具体的にどのようなデータ構造とアルゴリズムを用いるかは CC protocol によって異なります。
 17 | 
 18 | 
 19 | == 直列実行ではもったいない
 20 | 
 21 | トランザクションを直列にひとつずつ実行すれば Isolation は完璧です。
 22 | 昔は直列で良かったんじゃないかと思われそうですが、
 23 | CPU がひとつしかなくても HDD が遅かったため、IO 実行中に CPU がヒマしているのは
 24 | リソースがもったいないわけで、並行実行したいというモチベーションはありました。
 25 | 現代はひとつのサーバだけ見ても CPU コアがたくさんあり、メモリも潤沢で、
 26 | 永続ストレージも Flash memory やら NVRAM やら高速な選択肢が豊富になりました。
 27 | 現代のアーキテクチャにおいて直列実行しかできないのでは、
 28 | 昔にも増してリソースがもったいないということになります。
 29 | 
 30 | 
 31 | == 並行実行制御の難しさ
 32 | 
 33 | 直感的には、まったく異なるレコードにアクセスするなら並列に実行しても
 34 | 何の問題もなさそうじゃないか、と思います。はい、そのとおりです。
 35 | では、アクセスするレコード集合(ここでは Read/write set と呼びます)
 36 | がトランザクション実行前に把握できるでしょうか。
 37 | 実は、限られたものを除けば、難しいです。
 38 | 仮に One-shot トランザクションのように外部とのやりとりが途中でないようなトランザクションに限ったとしても、
 39 | 一般に、Read/write set はデータベースの状態に依存して決まります。
 40 | トランザクションロジックは、
 41 | Database 状態と入力を引数にとり、変更後の Database 状態と出力を返り値とする
 42 | 副作用のない関数、
 43 | @<tt>{function do_transaction(before_database, input)} @<m>{\rightarrow} @<tt>{(after_database, output)} と解釈できます。
 44 | @<tt>{do_transaction} の中身を静的解析 (@<tt>{before_database} なしで分かる情報を得るという意味です)
 45 | できたとしても、限られたケース以外では Read/write set を決定するのは無理ですね。
 46 | 限られたケースとは、@<tt>{before_database} の状態に依存せずに Read/write set が確定する場合です。
 47 | 例えば @<tt>{do_transaction} 内に条件分岐があり、それによって Read/write set が変わるとしたら、
 48 | 実行前に確定させるのは無理です。
 49 | 
 50 | もし @<tt>{before_database} も使えれば Read/write set はトランザクション実行開始前に
 51 | ほぼ把握できるはずだ、と思ったあなた、それは正しいです。
 52 | しかし、@<tt>{before_database} を使うということは、
 53 | トランザクションロジックを実行してみることと多くの場合同じではないでしょうか。
 54 | グレーゾーンはありますが、典型的には、@<tt>{before_database} に依存しないトランザクションロジックであれば、
 55 | トランザクション開始時に Read/write set を確定させることができます。
 56 | そのような仮定の元で動作する DBMS を Deterministic DBMS と呼びます。
 57 | 読んだデータに基づく条件分岐や @<tt>{join} 操作など、Deterministic DBMS の仮定が成り立たない
 58 | ロジックはすぐに思いつきますので、Deterministic DBMS の適用範囲は相対的に狭くなります。
 59 | Deterministic DBMS ではない、すなわち、トランザクション開始時には
 60 | Read/write set が不明であるとの立場をとる DBMS を Non-deterministic DBMS と呼びます。
 61 | 静的解析だとか過去のワークロードから Read/write set を推定などする手法も、
 62 | 広い意味での Non-derministic DBMS に分類することにしましょう。
 63 | 
 64 | 本書は Non-deterministic DBMS を作ることを想定します。
 65 | Non-deterministic DBMS の CC protocol は
 66 | @<tt>{do_transaction} を実行しながら Isolation を担保するために頑張る必要があります。
 67 | 
 68 | 
 69 | == Serializability
 70 | 
 71 | Serializablility と日本語では「直列化可能性」と訳されます。
 72 | トランザクションの理論では、各トランザクションは有限の長さの Read/write オペレーション列を持っています。
 73 | CC を処理する機構を Scheduler とよび、Scheduler は複数のトランザクションの
 74 | オペレーション同士を適切に順序づけたり、
 75 | Multi-version の場合は Read-from 関係を決定したりします。
 76 | Scheduler が生成したオペレーション順序(や Read-from 関係)を Schedule もしくは History といいます。
 77 | 
 78 | ここで、Mono-version model および Multi-version model について説明します。
 79 | Mono-version model は、各 Record がひとつしか Version を保持しない、という仮定を置き、
 80 | Write operation は前の Version を上書きしてそれ以降読めなくすること、
 81 | Read operation はそのとき存在する Version を読むこととする、理論上のデータベースとその処理モデルです。
 82 | すなわち Mono-version model は、オペレーション順序から Reads-from 関係が一意に決まるモデルで、
 83 | 具体的には直前に同一 Record を書いたオペレーションが Reads-from 関係の対象となります。
 84 | よって、Mono-version model においては、オペレーション順序情報を Schedule として扱います。
 85 | 一方で、Multi-version model は、各 Record につき、無限の Version を持てるという仮定を置き、
 86 | Write operation は新しい Version を生成し、
 87 | Read operation は過去に書かれたどんな Version でも読めるとする、理論上のモデルです。
 88 | 現実にはもちろん無限には持てませんが。
 89 | Multi-version model は、Reads-from 関係が重要であり、その情報を Schedule として扱います。
 90 | CC protocol は Mono-version もしくは Multi-version のいずれかの世界を想定して設計されます。
 91 | 
 92 | ある Schedule が Serializable であるとは、
 93 | 同じトランザクション集合を直列に実行した(Trivial schedule と呼びます。
 94 | Trivial schedule における Reads-from 関係は Mono-version model の考え方を用いて
 95 | 直前に書かれたものを読むものとします) のと「等価」であることと定義されます。
 96 | トランザクションの数が @<m>{N} 個あれば、Trivial schedule は
 97 | トランザクションの並べ方の数すなわち @<m>{N!} 個存在しますが、
 98 | そのなかに与えられた Schedule と「等価」なものが存在すれば良いわけです。
 99 | 
100 | 「等価」とは何でしょうか。これには複数の考え方があります。
101 | 
102 | 
103 | === View Serializability
104 | 
105 | まず取りあげるのが、View が同じなら「等価」とみなす考え方です。
106 | View とは、各トランザクションが、どのトランザクションの書いた値を読んだか、
107 | すなわち Reads-from 関係を指します。
108 | ある Schedule について、View が同じ Trivial schedule が存在するとき、
109 | その Schedule は View-serializable であるといい、
110 | View-serializable な Schedule からなる集合を VSR といいます。
111 | Multi-version schedule の場合は Multi-version view serializable および MVSR と呼ばれます。
112 | MVSR はこれまで考えられている中で一番広い Serializable な Schedule 空間です。
113 | しかし、MVSR/VSR には扱いづらい点があります。
114 | それは View 等価である Trivial schedule を同定するのが難しいとことです。
115 | 理論上では、与えられた Schedule が (Multi-version) view serializable であるかどうかを決定する問題は NP-complete です。
116 | ただし、次々に実行されるトランザクションを処理していくオンラインスケジューラであれば、
117 | この理論に基づく Protocol が必ずしも非現実的とは限りません。
118 | 
119 | 
120 | === Conflict Serializability
121 | 
122 | MVSR や VSR が難しいとすると、
123 | 現実的な CC protocol が作れる良い性質はないだろうかという話になります。
124 | そのような性質は、あります。それは、競合関係(Conflicts)が同じなら「等価」とみなす考え方です。
125 | 具体的には、同一レコードにアクセスするトランザクションの関係のうち、
126 | 片方が Write をするものを競合関係と定義します。
127 | 競合関係は、オペレーションの実行順序を考慮して、
128 | Write-read (w-r)、Write-write (w-w)、Read-write (r-w) の 3 つです。
129 | これらは、それぞれ Flow dependency、Output dependency、Anti-dependency、とも呼ばれます。
130 | Read-read (r-r) は競合とはみなしません。
131 | 
132 | ある Schedule と競合関係が同じ Trival schedule が存在するとき、
133 | その Schedule は Conflict serializable であるといい、
134 | Conflict serializable な Schedule からなる集合を CSR といいます。
135 | CSR に含まれる Schedule は VSR や MVSR にもまた含まれます。
136 | 任意の Mono-version schedule について、
137 | Conflict serializable であれば、View serializable であることが導けます。
138 | 
139 | CSR は原則として Mono-version model を前提としますが、
140 | Multi-version model においても、Reads-from 関係を Write-read 関係とみなし、
141 | 上書きに相当する関係を Write-write とみなし、それに準じて Read-write 関係も定義することで、
142 | 同様に扱うことができます。
143 | Conflict serializable は競合等価となる候補の Trivial scheudler が一意に決まるので、
144 | 判定問題が NP-complete ではなく P に属します。
145 | よって、比較的扱いやすいです。
146 | 
147 | 
148 | ====[column] Multi-version model と Mono-version model の関係について
149 | 
150 | Serializability についての理論研究は Mono-version model から始まり、
151 | 後に Multi-version model に拡張されました。
152 | Mono-version schedule では各トランザクションがどの Record を Read/write したか、という情報すなわち
153 | Operation 集合、およびそれらの全順序 (半順序として扱う流儀もあります) すなわち Operation order を考え、
154 | Reads-from 関係 (Version function という写像で表現することもあります)は
155 | Operation order から一意に決まる (Standard version function と呼ばれます)
156 | ものとして議論されていました。
157 | 一方で、Multi-version model の世界になると、Reads-from 関係こそが Serializability を判定するための
158 | 主な情報で、Operation order は必ずしも必要ではなくなりますが、
159 | Mono-version model を拡張したという歴史的経緯でそれが残ってしまっています。
160 | 
161 | 本来 Mono-version model は Multi-version model に含まれます。
162 | よって、Operation order がない状況で Serializability や Recoverability などの議論をすべきです。
163 | その端緒となる「Multiversion View Serializability の簡潔な定義」@<fn>{simple_mvsr_definition}
164 | という記事を書きました。その記事には、
165 | 本来必要な Order とは Operation order ではなく、Transaction order であるということが書いてあります。
166 | Trivial schedule も Transaction order を用いて定義します。
167 | 
168 | ====[/column]
169 | 
170 | //footnote[simple_mvsr_definition][@<href>{https://qiita.com/starpoz/items/266ab514bbc308d438a6}]
171 | 
172 | 
173 | === Anomaly
174 | 
175 | (Multi-version) view serializable ではないということは、
176 | View 等価な Trivial schedule がひとつも存在しないことを意味します。
177 | ということは、どんな Transaction schedule を持ってきても、
178 | それとは View が一致しない、すなわち読むべき Version を読めていない Read operation が存在するということです。
179 | この Read operation の View は正常ではない、すなわち異常です。
180 | これを Anomaly と呼び、Dirty read とか、Lost update など、典型的パターンには名前がついています。
181 | しかし、名前がついている Anomaly を列挙していけば、View の異常を全て網羅できるとは考えない方が良いでしょう。
182 | 詳細が気になる人は、「いろんなAnomaly」@<fn>{footnote_various_anomaly} という記事がありますので参考にしてください。
183 | 
184 | //footnote[footnote_various_anomaly][いろんなAnomaly: @<href>{https://qiita.com/kumagi/items/5ef5e404546736ebac49}]
185 | 
186 | 
187 | 
188 | == CC protocol の分類
189 | 
190 | CC procotol は大きく分けて 4 種類あります。
191 | 2PL 系、TO 系、SI 系、Graph 系です。ひとつずつ説明します。
192 | 
193 | 
194 | === 2PL 系 CC protocol
195 | 
196 | 2PL は Two-Phase Locking の略です。
197 | MySQL InnoDB や Google Spanner などで採用されています。
198 | 名前の通り、各レコードを Lock (典型的には Reader-writer lock) を使って排他する方式です。
199 | 典型的な 2PL およびその亜種はレコード毎に Mutex object を用意し、Reader-writer lock を用いて排他制御を行います。
200 | あるトランザクションがアクセスする Record は必ず Read ロックまたは Write ロックを取って、
201 | 他のトランザクションが触れないようにします。
202 | Read ロック同士は共存できます。つまり、競合関係にあるトランザクション同士は排他制御されるというわけです。
203 | 2PL のルールは 1 つだけです。
204 | トランザクションの実行はロックの成長(Growing)フェーズと縮退(Shrinking)フェーズが
205 | それぞれひとつだけ存在することが求められます。
206 | トランザクション実行中にひとつでも Unlock したらそれ以降 Lock はできません、ということです。
207 | 2PL を使って生成できる Schedule は理論上 CSR と等しいです。
208 | 2PL は Mono-version model 前提のプロトコルで、
209 | 「最新」のデータ以外を読むことは想定されません。
210 | 似た名前の 2V2PL とか MV2PL などという Multi-version のプロトコルが(少なくとも研究としては)あるようですが、
211 | 別のプロトコルです。
212 | 
213 | Read locking をする代わりに楽観的に読む OCC (Optimistic Concurrency Protocol) も、
214 | 広義には 2PL に含まれます。
215 | OCC は Commit 処理のときに、Read set の内容を検証 (Verify) することで、
216 | 読んでから Verify までの間に他のトランザクションによって更新されなかったかどうかをチェックします。
217 | もし更新されていなかったら結果としてその期間 Read lock していたのと同じ効果を得られたと解釈できます。
218 | Write については Commit 処理まで遅らせたりはしますが、Lock します。
219 | OCC にも Growing phase と Shrinking phase は存在します。
220 | 2013 年に研究論文として発表された Silo というプロトコルが、洗練されています。
221 | 
222 | 
223 | === TO 系 CC protocol
224 | 
225 | TO とは Timestamp ordering の略です。
226 | CochroachDB などで採用されています。
227 | Timestamp ordering の基本は、トランザクション開始時に、
228 | ユニークな Timestamp を付与し、その Timestamp order を Serializable order とするように
229 | 実行する方式です。
230 | @<m>{ts(t)} はトランザクション @<m>{t} に付与された Timestamp を表すとします。
231 | トランザクション @<m>{t_1} が @<m>{t_2} の書いた @<m>{x} を読むときは、
232 | @<m>{ts(t_2) < ts(t_1)} を満たす必要があります。自分より新しい Timestamp のついているトランザクションの
233 | 書き込んだ値を読んではいけないということです。
234 | また、@<m>{ts(t_2) < ts(t_3) < ts(t_1)} となるような @<m>{x} を書いた @<m>{t_3} が存在しないようにする必要があります。
235 | これは、タイミングやプロトコルの詳細次第ではありますが、
236 | @<m>{t_3} 側を排除するか、@<m>{t_1} 側を排除するか、どちらかによって達成されます。
237 | TO は Mono-version model の制約の元で設計することもあるし、
238 | Multi-version model 用のもの (MVTO と呼ばれます) もあります。
239 | 
240 | 
241 | === SI 系 CC protocol
242 | 
243 | SI とは Snapshot isolation の略です。
244 | Oracle、PostgreSQL、TiDB などで採用されています。
245 | Snapshot isolation とは、トランザクション開始時に確定している Snapshot を読むことにして、
246 | 書くときは Write-write の競合のみを排除するという方式です。
247 | 残念ながら素の SI protocol は Serializable ではありません。
248 | SI に専用の検証器 (Certifier) を組み合わせて Serializable にする取り組みが、
249 | SSI (Serializable Snapshot Isolation) や SSN (Serial Safety Net) などの手法で提案されています。
250 | 検証器の仕事は、SI では通るけど Serializable にならないようなトランザクションを選んで排除することです。
251 | 多くの場合、Anti-dependency (r-w 競合) を記録し、その情報に基いて
252 | リスクのある構造を検知することで対象トランザクションを排除します。
253 | 
254 | 
255 | === Graph 系 CC protocol
256 | 
257 | 実用 DBMS では見たことがありませんが、
258 | トランザクションを Vertex、その依存関係や制約を edge とする
259 | Graph 構造をメンテナンスしながら、処理を進めるプロトコルです。
260 | 
261 | Conflicts に基づくのであれば、対応する Conflict graph という構造を、
262 | View に基づくのであれば、MVSG という Graph 構造を使います。
263 | どちらも、循環(Cycle)存在しないように Graph を構成できれば Serializable なので、
264 | 循環になる(なりそうな)トランザクションを排除 (Abort) させて処理を進めます。
265 | Graph 構造のメンテナンスはオーバーヘッドの大きさが懸念されたり、
266 | 古い  Vertex の GC など、難しさがあります。
267 | 
268 | 
269 | == S2PL プロトコル
270 | 
271 | CC protocol の具体例として、長らくデファクトスタンダードとして使われてきた
272 | S2PL (Strict two-phase locking) について紹介します。
273 | 
274 | S2PL プロトコルは、2PL に従いますが、Write lock の解放を Commit 完了後に行う制約を追加で守る必要のあるプロトコルです。
275 | これにより、S2PL は(適切に WAL 手法と連携する必要はありますが) Strictness も満たします。
276 | もっと強い制約を要求する SS2PL (strong strict two-phase locking) というプロトコルは、
277 | Write lock だけでなく Read lock の解放を Commit 完了後に行う制約を守る必要のあるプロトコルです。
278 | SS2PL は Rigorousness も満たします。
279 | つまり、2PL に対して、S2PL や SS2PL は 永続化 (WAL) のことも考慮されているプロトコルといえます。
280 | 
281 | S2PL のもう少し具体的な設計方針は、@<secref>{next-step|sec-direction-for-concurrency-control}に書きましたので
282 | 参考にしてください。
283 | 
284 | なお、先に紹介した Silo は、CC protocol の仕事と Logging の永続化を分離しており
285 | (元々は Early Lock Release という名前で議論された手法の本質を Silo は取り入れたと解釈して良いでしょう)、
286 | 永続化の遅延がスループットに影響を与えないような工夫をしながらも Strong recoverability 相当の保証を実現します。
287 | CC protocol と Logging の分離が今後の標準的な手法になるのは間違いないと私は思います。
288 | 
289 | 
290 | 
291 | == Serializable ではないプロトコル
292 | 
293 | 世の中の DBMS 実装においては、
294 | 性能が出ないなどの理由で、Isolation の性質を完全には満たさない、
295 | すなわち Serializable とはいえず、ワークロードによっては Anomaly が発生してしまう
296 | CC protocol が多くの場所で使われています。
297 | 例えば、Read committed と呼ばれるプロトロルです。SI もそうでしたね。
298 | Read committed は Read lock について 2PL のルールを満たさない S2PL を指すことがほとんどです。
299 | アプリケーションによってはそれらのプロトコルでも問題とならないケースは確かにあると思いますが、
300 | アプリケーションの設計者が問題が起きないように注意深く検討するべきなのは言うまでもありません。
301 | 
302 | 
303 | == CC protocol の実装について
304 | 
305 | CC protocol はトランザクションの並行/並列実行を前提としますので、
306 | インデクスも並列アクセスに対応しているデータ構造を使う必要があります。
307 | 2PL で使われる Reader-writer lock は CC のためのレコードアクセスの排他制御であって、
308 | インデクスを構成するデータ構造への並列アクセスには専用の排他制御が必要になります。
309 | 
310 | CC プロトコル以外の実装を極力サボってプロトタイプを作りたい場合は、
311 | ごくごく単純なデータベースとしてレコードの配列を用意して配列インデクスを Key と見做せば
312 | データ構造専用の排他制御が不要で、とりあえず並列に動かすことはできます。
313 | ただし、Key は @<m>{\\{0, 1, ..., N - 1\\\}} で固定ですし、
314 | Insert や Delete 操作にも対応できませんので、
315 | ごくごく単純なベンチマーク(YCSB など)しか実行できません。
316 | Thread-unsafe なデータ構造を使いながら、並行実行させるためには、
317 | 例えば User-level thread (Green thread とも呼ばれます) が使えます。
318 | C++ だと素朴にはできないのですが(coroutine のサポートがなされようとしているので期待)、
319 | 非同期実行の仕組みがあれば可能です。
320 | Thread-safe なデータ構造を使ってしまえば、並列実行ができます。
321 | 自作するのは大変なので、既存の Concurrent hash table や Concurrent balanced tree を使うのも手ですね。
322 | 
323 | 
324 | == その他の話題
325 | 
326 | これだけだと実用的なプロトコルには足りないのですが、キーワードのみを書いておきます。
327 | 気になった人は是非調べてみてください。
328 | 
329 |  * Deadlock prevension
330 |  * Phantom protection
331 |  * Early lock release
332 |  * Starvation
333 |  * Garbage collection (for multi-version CC protocol)
334 |  * External consistency (non-stale reads)
335 | 


--------------------------------------------------------------------------------
/config.yml:
--------------------------------------------------------------------------------
  1 | # review-epubmaker向けの設定ファイルの例。
  2 | # yamlファイルをRe:VIEWファイルのある場所に置き、
  3 | # 「review-epubmaker yamlファイル」を実行すると、<bookname>.epubファイルが
  4 | # 生成されます。
  5 | # このファイルはUTF-8エンコーディングで記述してください。
  6 | 
  7 | # この設定ファイルでサポートするRe:VIEWのバージョン番号。
  8 | # major versionが違うときにはエラーを出す。
  9 | review_version: 5.5
 10 | 
 11 | # ほかの設定ファイルの継承を指定できる。同じパラメータに異なる値がある場合は、
 12 | # 呼び出し元の値が優先される。
 13 | # A.yml、B.ymlのパラメータを継承する例。A.ymlとB.ymlに同じパラメータがある
 14 | # 場合、B.ymlの値が優先される。さらに今このファイルに同じパラメータがあるなら、
 15 | # その値がB.ymlよりも優先される。
 16 | # 同様にA.yml、B.yml内でさらにinherit:パラメータを使うこともできる。
 17 | # inherit: ["A.yml", "B.yml"]
 18 | 
 19 | # ブック名(ファイル名になるもの。ASCII範囲の文字を使用)
 20 | bookname: book
 21 | # 記述言語。省略した場合はja
 22 | language: ja
 23 | 
 24 | # 書名
 25 | # 読みを入れる例 booktitle: {name: "Re:VIEW EPUBサンプル", file-as: "リビューイーパブサンプル"}
 26 | booktitle: データベースシステム自作入門 v1.0
 27 | 
 28 | # 著者名。「, 」で区切って複数指定できる
 29 | # 読みを入れる例 aut: [{name: "青木峰郎", file-as: "アオキミネロウ"}, {name: "武藤健志", file-as: "ムトウケンシ"}, {name: "高橋征義", file-as: "タカハシマサヨシ"}, {name: "角征典", file-as: "カドマサノリ"}]
 30 | aut: [{name: "星野 喬", file-as: "ホシノ タカシ"}]
 31 | 
 32 | # 以下はオプション
 33 | # 以下はオプション(autと同じように配列書式で複数指定可能)。
 34 | # 読みの指定はaut:の例を参照。
 35 | # a-が付いているものはcreator側、
 36 | # 付いていないものはcontributor側(二次協力者)に入る
 37 | # a-adp, adp: 異なるメディア向けに作り直した者
 38 | # a-ann, ann: 注釈記述者
 39 | # a-arr, arr: アレンジした者
 40 | # a-art, art: グラフィックデザインおよび芸術家
 41 | # a-asn, asn: 関連・かつての所有者・関係者
 42 | # a-aqt, aqt: 大きく引用された人物
 43 | # a-aft, aft: 後書き・奥付の責任者
 44 | # a-aui, aui: 序論・序文・前書きの責任者
 45 | # a-ant, ant: 目録責任者
 46 | # a-bkp, bkp: メディア制作責任者
 47 | # a-clb, clb: 限定参加または補足者
 48 | # a-cmm, cmm: 解釈・分析・考察者
 49 | # a-csl, csl: 監修者
 50 | # a-dsr, dsr: デザイナ
 51 | # a-edt, edt: 編集者
 52 | # a-ill, ill: イラストレータ
 53 | # a-lyr, lyr: 歌詞作成者
 54 | # a-mdc, mdc: メタデータセットの一次的責任者
 55 | # a-mus, mus: 音楽家
 56 | # a-nrt, nrt: 語り手
 57 | # a-oth, oth: その他
 58 | # a-pht, pht: 撮影責任者
 59 | # a-pbl, pbl: 出版社（発行所）
 60 | # a-prt, prt: 印刷所
 61 | # a-red, red: 項目の枠組起草者
 62 | # a-rev, rev: 評論者
 63 | # a-spn, spn: 援助者
 64 | # a-ths, ths: 監督者
 65 | # a-trc, trc: 筆記・タイプ作業者
 66 | # a-trl, trl: 翻訳者
 67 | 
 68 | # 刊行日(省略した場合は実行時の日付)
 69 | date: 2022-08-16
 70 | # 発行年月。YYYY-MM-DD形式による配列指定。省略した場合はdateを使用する
 71 | # 複数指定する場合は次のように記述する
 72 | # [["初版第1刷の日付", "初版第2刷の日付"], ["第2版第1刷の日付"]]
 73 | # 日付の後ろを空白文字で区切り、任意の文字列を置くことも可能。
 74 | history: [["2018-08-28"], ["2019-08-14"], ["2021-08-22"], ["2022-06-21"], ["2022-08-16"]]
 75 | # 権利表記(配列で複数指定可)
 76 | # rights: (C) 2016 Re:VIEW Developers
 77 | # description: 説明
 78 | # subject: 短い説明用タグ(配列で複数指定可)
 79 | # type: 書籍のカテゴリーなど(配列で複数指定可)
 80 | # format: メディアタイプおよび特徴(配列で複数指定可)
 81 | # source: 出版物生成の重要なリソース情報(配列で複数指定可)
 82 | # relation: 補助的リソース(配列で複数指定可)
 83 | # coverage: 内容の範囲や領域(配列で複数指定可)
 84 | rights: (C) 2018 HOSHINO Takashi (licensed by CC BY-NC-SA 4.0)
 85 | 
 86 | 
 87 | # デバッグフラグ。nullでないときには一時ファイルをカレントディレクトリに作成し、削除もしない
 88 | #debug: null
 89 | debug: 1
 90 | 
 91 | # 固有IDに使用するドメイン。指定しない場合には、時刻に基づくランダムUUIDが入る
 92 | # urnid: urn:uid:http://example.com/book-title/
 93 | #
 94 | # ISBN。省略した場合はurnidが入る
 95 | # isbn: null
 96 | #
 97 | # HTMLファイルの拡張子(省略した場合はhtml)
 98 | # htmlext: html
 99 | #
100 | # CSSファイル(配列で複数指定可)
101 | stylesheet: ["style.css"]
102 | 
103 | # ePUBのバージョン (2か3)
104 | # epubversion: 2
105 | #
106 | # HTMLのバージョン (4か5。epubversionを3にしたときには5にする)
107 | # htmlversion: 4
108 | 
109 | # 目次として抽出する見出しレベル
110 | toclevel: 3
111 | 
112 | # 採番の設定。採番させたくない見出しには「==[nonum]」のようにnonum指定をする
113 | #
114 | # 本文でセクション番号を表示する見出しレベル
115 | secnolevel: 2
116 | 
117 | # 以下のsecnolevelはまだ未実装。
118 | # 前付でセクション番号を表示する見出しレベル(未実装)
119 | # pre_secnolevel: 0
120 | #
121 | # 後付(付録)でセクション番号を表示する見出しレベル(未実装)
122 | # post_secnolevel: 1
123 | #
124 | # 部番号を表示する見出しレベル(未実装)
125 | # part_secnolevel: 1
126 | 
127 | # 本文中に目次ページを作成するか。省略した場合はnull (作成しない)
128 | toc: true
129 | 
130 | # EPUB2標準の目次(NCX)以外に物理目次ファイルを作成するか。省略した場合はnull (作成しない)
131 | # ePUB3においてはこの設定によらず必ず作成される
132 | # mytoc: true
133 | 
134 | # 表紙にするHTMLファイル。ファイル名を指定すると表紙として入る
135 | # cover: null
136 | #
137 | # 表紙に配置し、書籍の影絵にも利用する画像ファイル。省略した場合はnull (画像を使わない)。画像ディレクトリ内に置いてもディレクトリ名は不要(例: cover.jpg)
138 | #coverimage: cover.jpg
139 | coverimage: null
140 | #
141 | # 表紙の後に大扉ページを作成するか。省略した場合はtrue (作成する)
142 | # titlepage: true
143 | #
144 | # 自動生成される大扉ページを上書きするファイル。ファイル名を指定すると大扉として入る (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)
145 | # titlefile: null
146 | #
147 | # 原書大扉ページにするHTMLファイル。ファイル名を指定すると原書大扉として入る (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)
148 | # originaltitlefile: null
149 | #
150 | # 権利表記ページファイル。ファイル名を指定すると権利表記として入る (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)
151 | # creditfile: null
152 | 
153 | # 奥付を作成するか。デフォルトでは作成されない。trueを指定するとデフォルトの奥付、ファイル名を指定するとそれがcolophon.htmlとしてコピーされる
154 | # colophon: null
155 | 
156 | # 裏表紙データファイル (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)
157 | # backcover: null
158 | 
159 | # プロフィールページファイル  (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)。ファイル名を指定すると著者紹介として入る
160 | # profile: null
161 | # プロフィールページの目次上の見出し
162 | # profiletitle: 著者紹介
163 | 
164 | # 広告ファイル。ファイル名を指定すると広告として入る (PDFMaker向けにはLaTeXソース断片、EPUBMaker向けにはHTMLファイル)
165 | # advfile: null
166 | 
167 | # 取り込む画像が格納されているディレクトリ。省略した場合は以下
168 | # imagedir: images
169 | 
170 | # 取り込むフォントが格納されているディレクトリ。省略した場合は以下
171 | # fontdir: fonts
172 | 
173 | # imagedir内から取り込まれる対象となるファイル拡張子。省略した場合は以下
174 | # image_ext: ["png", "gif", "jpg", "jpeg", "svg", "ttf", "woff", "otf"]
175 | 
176 | # fontdir内から取り込まれる対象となるファイル拡張子。省略した場合は以下
177 | # font_ext: ["ttf", "woff", "otf"]
178 | 
179 | # ソースコードハイライトを利用する (rouge,pygmentsには外部gemが必要)
180 | # highlight:
181 | #   html: "rouge"
182 | #   latex: "listings"
183 | 
184 | # カタログファイル名を指定する
185 | # catalogfile: catalog.yml
186 | 
187 | # 1ページの行数文字数と1kbごとのページ数を用紙サイズで指定する(A5 or B5)。
188 | # page_metric: A5
189 | #
190 | # あるいは、配列で指定することもできる
191 | # 各数字の意味は、順にリストの行数、リストの1行字数、テキストの行数、テキストの1行字数、1kバイト毎のページ数
192 | # page_metric: [40,80,40,80,2]
193 | 
194 | # ページ送りの送り方向、page-progression-directionの値("ltr"|"rtl"|"default")
195 | # direction: "ltr"
196 | 
197 | # EPUBのOPFへの固有の追加ルール
198 | # <package>要素に追加する名前空間
199 | # opf_prefix: {ebpaj: "http://www.ebpaj.jp/"}
200 | # 追加する<meta>要素のプロパティとその値
201 | # opf_meta: {"ebpaj:guide-version": "1.1.3"}
202 | 
203 | # 以下のパラメータを有効にするときには、
204 | # epubmaker:
205 | #    パラメータ: 値
206 | #    パラメータ: 値
207 | #   ...
208 | # という構成にする必要がある(インデントさせる)
209 | 
210 | epubmaker:
211 |   # HTMLファイルの拡張子
212 |   htmlext: xhtml
213 |   #
214 |   # 目次を要素の階層表現にしない。省略した場合(null)は階層化する。
215 |   # 特に部扉が入るなどの理由で、構成によっては階層化目次でepubcheckに
216 |   # パスしない目次ができるが、そのようなときにはこれをtrueにする
217 |   # flattoc: null
218 |   #
219 |   # 目次のインデントレベルをスペース文字で表現する(flattocがtrueのときのみ)
220 |   # flattocindent: true
221 |   #
222 |   # NCX目次の見出しレベルごとの飾り(配列で設定)。EPUB3ではNCXは作られない
223 |   # ncxindent:
224 |   #-
225 |   #- -
226 |   # フックは、各段階で介入したいときのプログラムを指定する。自動で適切な引数が渡される
227 |   # プログラムには実行権限が必要
228 |   # ファイル変換処理の前に実行するプログラム。スタイルシートのコンパイルをしたいときなどに利用する。
229 |   # 渡される引数1=作業用展開ディレクトリ
230 |   # hook_beforeprocess: null
231 |   #
232 |   # 前付の作成後に実行するプログラム。作業用展開ディレクトリにある目次ファイル(toc-html.txt)を操作したいときなどに利用する。
233 |   # 渡される引数1=作業用展開ディレクトリ
234 |   # hook_afterfrontmatter: null
235 |   #
236 |   # 本文の変換後に実行するプログラム。作業用展開ディレクトリにある目次ファイル(toc-html.txt)を操作したいときなどに利用する。
237 |   # 渡される引数1=作業用展開ディレクトリ
238 |   # hook_afterbody: null
239 |   #
240 |   # 後付の作成後に実行するプログラム。作業用展開ディレクトリにある目次ファイル(toc-html.txt)を操作したいときなどに利用する。
241 |   # 渡される引数1=作業用展開ディレクトリ
242 |   # hook_afterbackmatter: null
243 |   #
244 |   # 画像およびフォントをコピーした後に実行するプログラム。別の画像やフォントを追加したいときなどに利用する。
245 |   # 渡される引数1=作業用展開ディレクトリ
246 |   # hook_aftercopyimage: null
247 |   #
248 |   # ePUB zipアーカイブ直前に実行するプログラム。メタ情報などを加工したいときなどに利用する。
249 |   # 渡される引数1=ePUB準備ディレクトリ
250 |   # hook_prepack: null
251 |   #
252 |   # 変換したHTMLファイルおよびCSSを解析して厳密に使用している画像ファイルだけを取り込むか。デフォルトはnull(imagesディレクトリすべてを取り込む)
253 |   # なお、フォント、カバー、広告についてはこの設定によらずディレクトリ内のものがすべて取り込まれる
254 |   # verify_target_images: null
255 |   #
256 |   # verify_target_imagesがtrueの状態において、解析で発見されなくても強制的に取り込むファイルの相対パスの配列
257 |   # force_include_images: []
258 |   #
259 |   # 画像ファイルの縦x横の最大ピクセル数許容値
260 |   # image_maxpixels: 4000000
261 |   #
262 |   # Re:VIEWファイル名を使わず、前付にpre01,pre02...、本文にchap01,chap02l...、後付にpost01,post02...という名前付けルールにするか
263 |   # rename_for_legacy: null
264 |   #
265 |   # ePUBアーカイブの非圧縮実行
266 |   # zip_stage1: "zip -0Xq"
267 |   #
268 |   # ePUBアーカイブの圧縮実行
269 |   # zip_stage2: "zip -Xr9Dq"
270 |   #
271 |   # ePUBアーカイブに追加するパス(デフォルトはmimetype、META-INF、OEBPS)
272 |   # zip_addpath: null
273 |   #
274 |   # EPUBで表紙をコンテンツに含めるか。デフォルトでは作成されない。yesにするとiBooks等でも最初に表紙が表示されるようになる
275 |   # cover_linear: null
276 |   #
277 |   # @<href>タグでの外部リンクを禁止し、地の文にする(falseで禁止する)
278 |   # externallink: true
279 |   #
280 |   # epubmaker:階層を使うものはここまで
281 | 
282 | # LaTeX用のスタイルファイル(styディレクトリ以下に置くこと)
283 | texstyle: reviewmacro
284 | #
285 | # LaTeX用のdocumentclassを指定する
286 | # texdocumentclass: ["jsbook", "uplatex,oneside"]
287 | texdocumentclass: ["review-jsbook", "media=ebook,paper=b5,gutter=26mm,head_space=35mm"]
288 | #
289 | # LaTeX用のコマンドを指定する
290 | # texcommand: "uplatex"
291 | #
292 | # LaTeXのコマンドに渡すオプションを指定する
293 | # texoptions: null
294 | #
295 | # LaTeX用のdvi変換コマンドを指定する(dvipdfmx)
296 | # dvicommand: "dvipdfmx"
297 | #
298 | # LaTeX用のdvi変換コマンドのオプションを指定する
299 | # dvioptions: "-d 5"
300 | 
301 | # 以下のパラメータを有効にするときには、
302 | # pdfmaker:
303 | #    パラメータ: 値
304 | #    パラメータ: 値
305 | #   ...
306 | # という構成にする必要がある(インデントさせる)
307 | #
308 | pdfmaker:
309 |   #
310 |   # TeXコンパイル前に実行するプログラム。変換後のTeXソースを調整したいときに使用する。
311 |   # 渡される引数1=作業用展開ディレクトリ、引数2=呼び出しを実行したディレクトリ
312 |   # hook_beforetexcompile: null
313 |   #
314 |   # TeXコンパイル後に実行するプログラム。索引作業をして再度コンパイルしたいときなどに使用する。
315 |   # 渡される引数1=作業用展開ディレクトリ、引数2=呼び出しを実行したディレクトリ
316 |   # hook_aftertexcompile: null
317 |   #
318 |   # PDF(book.pdf)作成後に実行するプログラム。PDFに加工を施したいときに使用する。
319 |   # 渡される引数1=作業用展開ディレクトリ、引数2=呼び出しを実行したディレクトリ
320 |   # hook_afterdvipdf: null
321 |   #
322 |   # 画像のscale=X.Xという指定を画像拡大縮小率からページ最大幅の相対倍率に変換する
323 |   # image_scale2width: true
324 |   #
325 |   # PDFやIllustratorファイル(.ai)の画像のBoudingBoxの抽出に指定のボックスを採用する
326 |   # cropbox(デフォルト), mediabox, artbox, trimbox, bleedboxから選択する。
327 |   # Illustrator CC以降のIllustratorファイルに対してはmediaboxを指定する必要がある
328 |   # bbox: mediabox
329 |   #
330 |   # 奥付を作成するか。trueを指定するとデフォルトの奥付、ファイル名を指定するとそれがcolophon.htmlとしてコピーされる
331 |   #colophon: true
332 |   colophon: false
333 |   # pdfmaker:階層を使うものはここまで
334 | 
335 | mathformat: mathml
336 | 


--------------------------------------------------------------------------------
/data.re:
--------------------------------------------------------------------------------
  1 | = データ
  2 | 
  3 | 
  4 | 「データベースシステム」って何でしょうか。「システム」は、複数の要素が
  5 | 集まっていてそれらが相互作用しながら何らかの共通した目的のために動いて
  6 | いるものです。ここでの「システム」は、「データベース」を保持管理処理す
  7 | るためのソフトウェアやハードウェア全体のことを指すと考えるのが良いでしょ
  8 | う。それでは、「データベース」って何でしょうか。「ベース」という言葉は
  9 | 基地という意味なので、「データ」がたくさん整理された状態で管理されてい
 10 | るものだと考えるのが良いでしょう。それでは、「データ」って何でしょうか。
 11 | この章では「データ」とは何かについて考えます。
 12 | 
 13 | 
 14 | 
 15 | == 基本データ型とその等価性および順序
 16 | 
 17 | データのそれ以上分解できない基本的な単位を考えましょう。
 18 | それは、例えば、整数であったり、文字列であったり、日付だったり、バイナリデータだったりというものです。
 19 | それらを基本データ型(Primitive data type)と呼びます。
 20 | 基本データ型である整数型の具体的な値は例えば 1 や 2 です。これらの値は整数型のインスタンスともいいます。
 21 | 皆さんはデータベースシステムよりプログラミング言語の知識をたくさん持っていると思いますから、
 22 | プログラミング言語を語るときに用いられる用語を適宜使って説明します。
 23 | 
 24 | 同じ型の値をどうやって区別しましょうか。
 25 | それには等価性(Equality)を使います。
 26 | 型 @<tt>{A} のデータ(変数) @<tt>{a1, a2} の値が等しいとき @<tt>{a1 == a2} とかき、
 27 | 等しくないとき @<tt>{a1 != a2} と書くことにしましょう。多くのプログラミング言語でこう書きますからね。
 28 | 基本データ型であれば値が同じ(値は何らかのバイト列もしくはビット列で表現されるとして、
 29 | それがまったく同じという意味です)であれば等しい、違えば等しくない、
 30 | という定義でまず実用上差し支えないでしょう。
 31 | たとえば、整数の 1 と 2 があったとき、@<tt>{1 == 1} で @<tt>{1 != 2} ですね。
 32 | 文字列だと、@<tt>{"aaa" == "aaa"、"aaa" != "aab"、"aaa" != "aaaa"} などです。
 33 | 
 34 | 等価性に加えて、同じ型の値同士でよく用いられる関係が、順序(Order) です。
 35 | 特に全順序がよく使われます。
 36 | 整数は全順序集合ですね。@<tt>{1 < 2} ですし、@<tt>{2 < 3} です。
 37 | 日付も過去より現在、現在より未来が新しいという順序を持っています。
 38 | 文字列は辞書順で大小関係を扱うことが多いです。@<tt>{"aa" < "aab" < "ab" < "abc" < "ba" < "bb"} など。
 39 | 自分で作った構造体に任意の順序をつけることもありますね。
 40 | 等価性は前提とすることが多いので @<tt>{==} が定義されており、さらに @<tt>{<} という演算子が
 41 | 適切に定まれば全順序を定義できます。@<fn>{cpp-order}
 42 | //footnote[cpp-order][C++ などでは、@<tt>{!(a < b) && !(b < a)} ならば @<tt>{a == b} とする考え方もあります。これは Total order を前提としているのはいうまでもありません。]
 43 | 
 44 | 
 45 | データベースを扱うときにデータの等価性はまず間違いなく必須ですが、
 46 | 順序については必ずしも必要ありません。
 47 | あるデータ型の値の部分集合を考えるとき、
 48 | 順序を持つデータ型は範囲で表現することができ、
 49 | これを利用した範囲検索という効率的なアクセスメソッドを提供できるのが
 50 | 特徴的です。
 51 | 一方で、順序を持たない(定義しない)データ型については、
 52 | 等価性を用いた検索と、全件検索(いわゆるフルスキャン)のみが可能です。
 53 | 
 54 | 
 55 | 
 56 | == Record、Table、Key
 57 | 
 58 | 
 59 | データとは基本データ型の値の集合といえます。
 60 | Relational database systems (関係データベースシステム、以後 RDBMS とかきます)では、
 61 | 基本データ型を複数まとめて、Record 型というものを定義して使います。
 62 | Record 型の値は Record (または Record 値) と呼ばれます。Tuple 型、Tuple (Tuple 値) と呼ばれることもあります。
 63 | Tuple という言い方はプログラミング言語でもそのまま使いますね。
 64 | Record 型の中の要素を区別するために、それらを Column とか Field と呼び、
 65 | 区別しやすいように名前をつけます。それらの名前は Column 名、Field 名と呼びます。
 66 | Record 型は、プログラミング言語でいうところの構造体 (struct) に相当します。
 67 | 
 68 | RDBMS では Record 集合を管理するために、Table という概念が使われます。
 69 | ひとつの Table には同じ Record 型のデータが複数格納されます。
 70 | RDBMS では Record 型には名前をつけ(られ)ず、Table に名前をつけることで、事実上
 71 | Record 型に名前をつけたのとほとんど同じ使い方ができます。
 72 | ただし、同じ Record 型を複数の Table で管理できる点で少し異なります
 73 | (構造が同じだけれど、別物として扱うということ)。
 74 | 
 75 | RDBMS では Record 型を入れ子 (Nested) にして定義することは想定されない場合が多いようです。
 76 | これはデータ重複を防ぐ「正規形」の考え方があるためだと思われます。
 77 | 「正規形」「正規化」はデータベーススキーマ
 78 | (Record 型、Table、Key やその他の制約等の定義をまとめたもの)が持っているべき性質
 79 | やスキーマの正規形への変換方法を意味します。
 80 | トランザクション処理とは直接関係ないので、ここではこれ以上説明しません。
 81 | トランザクション処理においては、ひとつの Record (場合によってはその中の Column)を
 82 | それ以上分割されないデータアクセスの最小単位と考えます。
 83 | 
 84 | 以下にスキーマとその Record の例を示しました:
 85 | 
 86 | //list[schema_example][]{
 87 | Schema example:
 88 | 
 89 | Table Human:
 90 |   (id: integer, last_name: string, first_name: string, birthday: date)
 91 | 
 92 | 
 93 | Records of Human table:
 94 |   (1, 'tanaka', 'ichiro', 2000-01-01)
 95 |   (2, 'yamada', 'hanako', 2001-08-08)
 96 |   (3, 'suzuki', 'jiro',   2000-01-01)
 97 | //}
 98 | 
 99 | @<tt>{Human} table がひとつ定義されています。@<tt>{Human} の Record 型は
100 | @<tt>{id, last_name, first_name, birthday} という 4 つの Column から構成されます。
101 | それぞれの Column は基本データ型の @<tt>{integer, string, string, date} という型です。
102 | 3 つの Record が具体例として挙げられています。
103 | Record 型に含まれる複数の Column 型にはそれぞれ名前がついているので、
104 | 順序がないと考えることも可能ですが、
105 | ここでは、プログラミング言語における struct に倣って順序を含めることにしましょう。
106 | 
107 | 同じ Record 型のふたつの Record が等しいとは、素朴には全 Column の値が等しいことを意味しますが、
108 | 常にその条件で Record 同士を区別したいわけではありません。
109 | 同一性には関係ない補足情報を含めたいときもあるでしょう。
110 | 一般に Record の区別をするときには Key という概念が使われます。
111 | Key は Record を入力とする関数もしくはその関数値と考えることができます。
112 | より狭義には、Record 型に含まれる一部の Column 型からなる列を考え、
113 | 対応する Record (値) から該当する Column (値) 列を作る関数(一般に Projection と呼ばれます)を
114 | 考えます。この場合は関数そのものよりも、元になる Column 型の列で表現することが多いので、
115 | これを、便宜上 Key 型と呼ぶことにします。Key 型を使って、Record から Projection によって作られた値を、
116 | Key もしくは Key 値と呼ぶことにします。
117 | 型と値は区別されますが、文脈でどちらのことを指しているのか分かる場合は、単に Key と呼びます。
118 | 例えば Table A の Key と言ったときは、Table A の Record 型から作られる何らかの Key 型を指すものとし、
119 | ある Record の Key と言ったときは、その Record における何らかの Key 値を指す、などです。
120 | 
121 | ひとつの Table について Column の選び方やその順序によって Key 型は複数存在します。
122 | 一般に、Record と Key の対応は N:1 の関係があります(ここでの N は一般に複数という意味)。
123 | アプリケーションの視点で、ある Key が Record を区別するのに十分な情報を持っていると見做せるとき、
124 | すなわち、Record と Key の対応に 1:1 の関係があると見做せるとき、
125 | その Key (型) は Unique key (型) といいます。
126 | 
127 | 以下に Key の例を示しました:
128 | 
129 | //list[key_example][]{
130 | 
131 | Name key of Human table:
132 |   (last_name, first_name)
133 | 
134 | Birthday key of Human table:
135 |   (birthday)
136 | 
137 | NameAndBirthday key of Human table:
138 |   (last_name, first_name, birthday)
139 | 
140 | Id unique key of Human table:
141 |   (id)
142 | 
143 | 
144 | Name key of records:
145 |   ('tanaka', 'ichiro')   id = 1
146 |   ('yamada', 'hanako')   id = 2
147 |   ('suzuki', 'jiro')     id = 3
148 | 
149 | Birthday key of records:
150 |   (2000-01-01)  id = 1,3
151 |   (2001-08-08)  id = 2
152 | 
153 | NameAndBirthday key of records:
154 |   ('tanaka', 'ichiro', 2000-01-01)  id = 1
155 |   ('yamada', 'hanako', 2001-08-08)  id = 2
156 |   ('suzuki', 'jiro',   2000-01-01)  id = 3
157 | 
158 | ID key of records:
159 |   (1)
160 |   (2)
161 |   (3)
162 | //}
163 | 
164 | 
165 | @<tt>{Human} table に 4 つの Key (型)を定義しています。
166 | @<tt>{Name, Birthday, NameAndBirthday}, そして @<tt>{Id} です。
167 | RDBMS では Key の定義は対応するインデクスの作成指示を意味しますが、
168 | ここでは単にこのような Key 型を考えてみるという意味で捉えてください。
169 | @<tt>{Name} key は @<tt>{(last_name, first_name)} と書いてありますが、
170 | これは、@<tt>{Name} key は、@<tt>{Human} 型の Record を入力とし、
171 | その Column のうち @<tt>{last_name} および @<tt>{first_name} のみ取り出して Tuple を生成し、
172 | それを出力とする Projection 関数と考えます。
173 | 
174 | ここで @<tt>{Name} は Unique key でしょうか？ 例の 3 つの Record を見る限りでは
175 | 重複しているものはなさそうなので、いまのところ Unique になっているようですが、
176 | 今後 Record が追加された場合は Unique 性が担保されなくなってしまうかも知れません。
177 | 実は Unique key というのは、現状そうなっているという性質のことではなくスキーマに与える制約のことなのです。
178 | @<tt>{Human} table (型) を定義した人、ここでは管理者とします、が想定する潜在的な Record 集合が
179 | どのようなものかによって決まります。
180 | つまり、管理者がその Key の Unique 性を担保したい場合、システムに制約の指示を与えます。
181 | Unique key 制約が与えられた場合、たとえば、@<tt>{Name} key が Unique だと管理者が指定した場合、
182 | システムは @<tt>{(last_name, first_name)} の組が Unique でなくなるような操作を許しません。
183 | たとえば、既に @<tt>{('tanaka', 'ichiro')} という Name key を持つ Record が存在するのに、同じ
184 | @<tt>{('tanaka', 'ichiro')} を持つ別の Record は、例え他の Column が異なっていても追加できなくなります。
185 | (逆に、典型的な RDBMS は Unique 制約がなければ何もかも同じ Record を複数登録できます。)
186 | もちろん一般には @<tt>{Name} は Unique ではないので、Name を Unique key にすると不便です。
187 | ならば @<tt>{NameAndBirthday} はどうでしょうか。
188 | 実際に同性同名で誕生日も同じの人がいる可能性はかなり低いでしょうがゼロというわけでもないでしょう。
189 | 
190 | Table ひとつにつき、その Unique key の中で主要なものひとつを Primary key と呼びます。
191 | 明示的な Primary key がない場合は、隠し Column が用意され、
192 | Table 内で Unique な整数が割り当てられ、Primary key として扱われることが多いです。
193 | (例えば MySQL InnoDB はそのような実装となっています。)
194 | これをサロゲートキー、もしくは代理キーと呼びます。
195 | この例では @<tt>{Id} key が代理キーです。
196 | 
197 | //note{
198 | 今の時代なら皆さんにはマイナンバーが割り当てられていますね。
199 | 原則として個人にひとつ Unique な番号を割り当てられることを仕組みとして担保しているので、
200 | 国や自治体が国民/住民のデータベースを管理する場合は、
201 | システム毎に代理キー @<tt>{Id} を割り振るよりも、
202 | Primary key としてマイナンバーを使った方が良いと考える向きもあるかも知れません。
203 | しかし、データベースの扱いにおいて個人情報の保護など別の社会的法律的な制約が発生したり、
204 | 未来永劫同じ番号が使い回されることがないのかなど、
205 | Primary key として採用することに疑問がないわけではありません。
206 | アプリケーション・データベース設計において、Primary key をどうするかひとつとっても、
207 | 要件に立ち返って考える必要があったりしますので注意したいところです。
208 | //}
209 | 
210 | 
211 | ある Table について、任意の Key 値を指定すれば、複数の Record がマッチし得ます。
212 | もちろん存在しない Key 値を指定すればマッチするのは 0 個です。
213 | 例えば、Human table から Birthday key の値として @<tt>{2000-01-01} を指定すると、
214 | @<tt>{id 1} と @<tt>{3} の 2 つの Record がマッチします。
215 | Unique key の場合は高々 1 つの Record がマッチします。
216 | データベースにおいてデータを指定する最も基本的な操作が、ある Table において
217 | Key 値を与えて Table を構成する Record 集合の部分集合を指定する操作です。
218 | 等価性を用いる場合は、指定したい等価な Key 値の集合を与えます。
219 | 順序を用いる場合は、指定したい Key 値の範囲を与えます。
220 | 演算子や関数を使ってより複雑な条件を指定することも出来ますが、
221 | 最終的には、複数 Table の複数 Record に何らかの順番でアクセスすることになります。
222 | 
223 | 複数の Column 値から構成される Key 値の順序を考える場合、典型的には辞書順を用います。
224 | 2 つの整数型からなる Key があって、@<tt>{(a, b)} と表すとき、
225 | その Key の順序は例えば @<tt>{(1, 1) < (1, 2) < (2, 1)} となります。
226 | もちろん、任意の Key について任意の順序を定義し得るわけですが、
227 | 自動的に決まる順序として辞書順が採用されるシステムが多いです。
228 | 逆に、ある順序で扱いたいから辞書順でそうなるように Key を定義することもあるでしょう。
229 | RDBMS の実装によっては、基本データ型が持つ自然な順序を Ascending (昇順)、
230 | その逆順を Descending (降順) としてそれぞれ @<tt>{ASC, DESC} の演算子で扱えるものがあります。
231 | 
232 | 
233 | ====[column] 順序と全順序
234 | 
235 | 集合が順序や全順序を持つためにはある性質を満たす必要があります。
236 | 具体的には集合の元についての二項関係を表す演算子 @<m>{\le} が反射律、反対称律、推移律を満たせば(半)順序であり、
237 | 加えて、集合の任意の 2 つの元が @<m>{\le} で比較可能である場合に全順序といいます。
238 | 
239 | 単純なルールとして、その型の任意の値をユニークな整数や実数に割り当てる関数(単射写像)を用意すれば、全順序の性質を満たします。
240 | 整数や実数の Tuple に割り当てても良いです。全順序の型で作る Tuple 型は辞書順を考えれば全順序となります。
241 | Record がそうだったように Key は基本データ型の Tuple でした。
242 | Key 型を構成する全ての Column の型が全順序の性質を持っていれば、
243 | その Key 値にも(辞書順を用いた)自然な全順序が定義されます。
244 | 
245 | ====[/column]
246 | 
247 | 
248 | 
249 | == データの関係とポインタ
250 | 
251 | 
252 | データは構造(関係)を持っています。
253 | プログラミング言語では、基本データ型に加えて、
254 | 構造体とポインタ(参照)型があれば、
255 | 任意のデータ構造を表現することが出来るでしょう@<fn>{footnote_array_type}。
256 | 
257 | //footnote[footnote_array_type][配列型もありますよ、というツッコミはナシでお願いします……]
258 | 
259 | RDBMS はポインタ型を直接的には扱わない特徴があります。
260 | では RDBMS でデータ同士の関係を表すにはどうすれば良いのでしょうか。
261 | それは、共通の部分データを持つことで表現します。
262 | R1, R2 という Record 型があり、それぞれが C1 という共通の Column 型を持つものとします。
263 | R1.C1 (R1 型における C1 column という意味) と R2.C1 が等しいレコード同士、
264 | すなわち、@<tt>{R1.C1 == R2.C1} である R1 型の record と R2 型の Record は
265 | 関係があるという見做せます。
266 | 同一 Record 型 (もしくは 同一 Table 内)の Record 同士に関連を持たせたい場合は、
267 | R1.C1 と R1.C2 という二つの Column を定義しておいて、@<tt>{R1.C1 == R1.C2} という形で関係を持たせることができます。
268 | これらの関係は、一般に、1:1、1:N、M:N という 3 種類のパターンに分類して考えます。
269 | 
270 | 無理矢理ポインタでどのような表現になるかを考えてみましょう。
271 | 1:1 の関係は、Record と Record をお互いがお互いを指している状態を表します。
272 | 1:N は、N 側の各 Record が 1 側の Record を指している状態、1 側は配列などを持っていて、そこに N 側を指すポインタが
273 | 複数格納されている状態を表します。
274 | M:N は M 側の各 Record が配列などで N 側の Record を指すポインタを複数保持している状態と、
275 | N 側の各 Record が配列などで M 側の Record を指すポインタを複数保持している状態と考えることができます。
276 | こんな複雑な関係をポインタで管理したくないですね:)
277 | 
278 | ポインタの参照外し(Dereference)に相当する操作は、内部結合 (Inner join) です。
279 | アプリケーションが自分でやっても良いですが、RDBMS に任せた方が原理的には高速です。
280 | (ただし、SQL は宣言的言語なので、Query optimizer が必ずしも良い実行計画を
281 | 選んでくれるわけではないという辛さがあります。
282 | そこでごにょごにょと Join の順番や使う Index を指定するなどのチューニングをすることで対応します。)
283 | 
284 | 何故ポインタを使わないか、という問いには歴史的経緯があるようなので、
285 | 興味のある人は調べてみてください@<fn>{footnote_no_pointer}。
286 | ポインタを扱わないことで、多少窮屈ですが Dangling pointer がない世界に住むことができます。
287 | 
288 | //footnote[footnote_no_pointer][「ぜひ押さえておきたいデータベースの教科書」 (Leo's Chronicle, @<href>{http://leoclock.blogspot.com/2009/01/blog-post_07.html}) という記事によると、Readings in Database Systems (Red Book, @<href>{http://www.redbook.io/}) の中の解説記事に書いてあるようです。2022 年現在 Red Book 5th Edition がオンラインで気軽に読めますが、目的の記事はおそらく過去の Edition にあった The Roots という章だと思いますが、私は確認できていません。おそらく Relational model と対比すべく Hierarchical(階層型)/Network(ネットワーク型) data model についての話が書いてあると推察します。]
289 | 
290 | 
291 | 
292 | 
293 | 
294 | 
295 | == 最も単純なデータベースのスキーマ
296 | 
297 | 最も単純なデータベースについて考えてみましょう。
298 | まず Table がひとつしかありません。
299 | その Table が採用する Record 型は Key を表す型と Key 以外のデータ Value を表す型の 2 つの Column で定義されます。
300 | Key は Primary key すなわち Unique key です。
301 | これは key-value store と呼ばれるものですね。
302 | Key は文字列型で、Value はバイト列であることが多いです。
303 | Key は文字列型として自然に定義される等価性と順序(辞書順)をサポートしています。
304 | 
305 | アプリケーションが数値型を必要とするなら、数値型を文字列型に変換して使います。
306 | 10進数を用いて数字を文字として足りない分を 0 埋めして桁数を固定した文字列に変換すれば、
307 | 辞書順と数値の昇順は一致させることができます。
308 | もちろん文字集合における順序が @<tt>{'0' < '1' < ... < '9'} を満たすことが前提となります。
309 | 例えば 10 桁固定にするとして 1 は '0000000001' に変換され、10 は '0000000010' に変換されます。
310 | '0000000001' < '0000000010' ですね。
311 | 負の数を扱いたいならコンピュータがそうしているように、符号を表す桁を一番最初に追加して、
312 | 補数を用いることで順序を保存したまま変換できます。
313 | 
314 | スキーマを自在に定義できるデータベースシステムはもちろん有用かつ必要ですが、
315 | 学習用として最初に作るべきは、このような単純な key-value を管理するシステムが望ましいです。
316 | なぜなら、これらの複雑さは本質的な仕組みにはあまり関係ないからです @<fn>{secondary-index}。
317 | 
318 | //footnote[secondary-index][Secondary index と呼ばれるものは、本質的な仕組みに関係あるかも知れません。]
319 | 
320 | 
321 | 
322 | ====[column] NULL について
323 | 
324 | RDBMS の Column はデフォルトで NULL 値が許容されているものがほとんどです。
325 | Haskell でいうところの Maybe 型、Rust でいうところの Option 型です。
326 | Unique 制約と同様に、Column に NOT NULL 制約を指定することはできます。
327 | 外部結合(Outer join)をするためには NULL 値が必要なのですが、
328 | 現代のプログラミングの常識から考えると、デフォルトは NOT NULL にして欲しいものですね。
329 | NULL を考慮し忘れると演算が想定外の結果になってしまうことがあります。
330 | 二項演算子やユーティリティ関数の引数にひとつでも NULL を渡すと結果の多くは NULL になり、
331 | これが罠となります。NULL を含めた演算ルールは三値論理という立派な名前がついているのですが、
332 | 多くの場合に我々が期待する演算は、NULL (Nothing, None) 値を何らかのデフォルト値に変換して演算することなのですね。
333 | 和のときは 0、積のときは 1、文字列連結のときは空文字列など。
334 | 
335 | ====[/column]
336 | 
337 | 
338 | ====[column] コンピュータサイエンスで使う数学
339 | 
340 | あなたがデータ構造やアルゴリズムについて考察したり、生み出したりしたとき、
341 | 定式化をする必要が出てくることがあります。
342 | コンピュータサイエンスで用いる数学について学ぶのに良い資料として、
343 | 
344 |  * Mathematics for Computer Science.
345 |  ** Eric Lehman, F Thomson Leighton, and Albert R Meyer.
346 |  ** @<href>{https://courses.csail.mit.edu/6.042/spring18/mcs.pdf}
347 | 
348 | を挙げておきます。
349 | 特に、集合の基礎と述語論理のところをきちんと学んで使えるように練習することが、
350 | 論文を読むときの定理や証明を理解するための第一歩であり、自分で定式化するときの道具にもなると思います。
351 | 私はごく最近(2018年現在)この資料の存在を知って勉強したので偉そうなことは言えません。
352 | この資料のライセンスは CC BY-SA 3.0 だそうです。太っ腹ですね。
353 | 
354 | ====[/column]
355 | 


--------------------------------------------------------------------------------
/doc/catalog.ja.md:
--------------------------------------------------------------------------------
 1 | # Re:VIEW カタログファイル ガイド
 2 | 
 3 | Re:VIEW のカタログファイル catalog.yml について説明します。
 4 | 
 5 | このドキュメントは、Re:VIEW 2.0 に基づいています。
 6 | 
 7 | ## カタログファイルとは
 8 | 
 9 | カタログファイルは、Re:VIEW フォーマットで記述された各ファイルを1冊の本（たとえば PDF や EPUB）にまとめる際に、どのようにそれらのファイルを構造化するかを指定するファイルです。現在はカタログファイルと言えば catalog.yml のことを指します。
10 | 
11 | ## catalog.yml を用いた場合の設定方法
12 | 
13 | catalog.yml 内で、`PREDEF`（前付け）、`CHAPS`（本編）、`APPENDIX`（付録、連番あり）、`POSTDEF`（後付け、連番なし）を記述します。CHAPS のみ必須です。
14 | 
15 | ```yaml
16 | PREDEF:
17 |   - intro.re
18 | 
19 | CHAPS:
20 |   - ch01.re
21 |   - ch02.re
22 | 
23 | APPENDIX:
24 |   - appendix.re
25 | 
26 | POSTDEF:
27 |   - postscript.re
28 | ```
29 | 
30 | 本編に対して、「部」構成を加えたい場合、`CHAPS` を段階的にして記述します。部の指定については、タイトル名でもファイル名でもどちらでも使えます。
31 | 
32 | ```yaml
33 | CHAPS:
34 |   - ch01.re
35 |   - 第1部:
36 |     - ch02.re
37 |     - ch03.re
38 |   - pt02.re:
39 |     - ch04.re
40 | ```
41 | 
42 | ## 古いバージョンについて
43 | 1.2 以前の Re:VIEW ではカタログファイルとして PREDEF, CHAPS, POSTDEF, PART という独立した4つのファイルを使用していました。古いカタログファイルを変換するツールとして、`review-catalog-converter` を提供しています。
44 | 
45 | このコマンドにドキュメントのパスを指定して実行後、生成された catalog.yml の内容が正しいか確認してください。
46 | 


--------------------------------------------------------------------------------
/doc/catalog.md:
--------------------------------------------------------------------------------
 1 | # Re:VIEW catalog.yml Guide
 2 | 
 3 | This article describes Re:VIEW catalog file catalog.yml.
 4 | 
 5 | ## What's catalog.yml
 6 | 
 7 | Catalog file shows the structure of files to generate books (such as PDF or EPUB) in Re:VIEW format.
 8 | Now we use catalog.yml as catalog file.
 9 | 
10 | ## How to write catalog.yml
11 | 
12 | In catalog.yml, you can write `PREDEF`(frontmatter), `CHAPS`(bodymatter), `APPENDIX`(appendix) and `POSTDEF`(backmater). `CHAPS` is required.
13 | 
14 | ```yaml
15 |   PREDEF:
16 |     - intro.re
17 |   
18 |   CHAPS:
19 |     - ch01.re
20 |     - ch02.re
21 |   
22 |   APPENDIX:
23 |     - appendix.re
24 |   
25 |   POSTDEF:
26 |     - postscript.re
27 | ```
28 | 
29 | You can add parts in body to use `CHAPS` in a hierarchy. You can use both title name and file name to specify parts.
30 | 
31 | ```yaml
32 |   CHAPS:
33 |     - ch01.re
34 |     - TITLE_OF_PART1:
35 |       - ch02.re
36 |       - ch03.re
37 |     - pt02.re:
38 |       - ch04.re
39 | ```
40 | 
41 | (For old version user: there is no `PART`. You write them in `CHAPS`.)
42 | 
43 | ## About earlier version
44 | 
45 | In version 1.x, Re:VIEW use 4 files PREDEF, CHAPS, POSTDEF, PART as catalog files.
46 | 
47 | You can convert there files with `review-catalog-converter`.
48 | When using it, you should compare with these files and the generated file `catalog.yml`.
49 | 


--------------------------------------------------------------------------------
/doc/customize_epub.ja.md:
--------------------------------------------------------------------------------
 1 | # EPUB ローカルルールへの対応方法
 2 | Re:VIEW の review-epubmaker が生成する EPUB ファイルは IDPF 標準に従っており、EpubCheck を通過する正規のものです。
 3 | 
 4 | しかし、ストアによってはこれに固有のローカルルールを設けていることがあり、それに合わせるためには別途 EPUB ファイルに手を入れる必要があります。幸い、ほとんどのルールは EPUB 内のメタ情報ファイルである OPF ファイルにいくつかの情報を加えることで対処できます。
 5 | 
 6 | Re:VIEW の設定ファイルは config.yml を使うものとします。
 7 | 
 8 | ## 電書協ガイドライン
 9 | * http://ebpaj.jp/counsel/guide
10 | 
11 | 電書協ガイドラインの必須属性を満たすには、次の設定を config.yml に加えます。
12 | 
13 | ```yaml
14 | opf_prefix: {ebpaj: "http://www.ebpaj.jp/"}
15 | opf_meta: {"ebpaj:guide-version": "1.1.3"}
16 | ```
17 | 
18 | これは次のように展開されます。
19 | 
20 | ```xml
21 | <package …… prefix="ebpaj: http://www.ebpaj.jp/">
22 |  ……
23 |     <meta property="ebpaj:guide-version">1.1.3</meta>
24 | ```
25 | 
26 | ただし、Re:VIEW の生成する EPUB は、ファイルやフォルダの構成、スタイルシートの使い方などにおいて電書協ガイドラインには準拠していません。
27 | 
28 | ## iBooks ストア
29 | デフォルトでは、iBooks で EPUB を見開きで開くと、左右ページの間に影が入ります。
30 | これを消すには、次のように指定します。
31 | 
32 | ```yaml
33 | opf_prefix: {ibooks: "http://vocabulary.itunes.apple.com/rdf/ibooks/vocabulary-extensions-1.0/"}
34 | opf_meta: {"ibooks:binding": "false"}
35 | ```
36 | 
37 | すでにほかの定義があるときには、たとえば次のように追加してください。
38 | 
39 | ```yaml
40 | opf_prefix: {ebpaj: "http://www.ebpaj.jp/", ibooks: "http://vocabulary.itunes.apple.com/rdf/ibooks/vocabulary-extensions-1.0/"}
41 | opf_meta: {"ebpaj:guide-version": "1.1.3", "ibooks:binding": "false"}
42 | ```
43 | 


--------------------------------------------------------------------------------
/doc/customize_epub.md:
--------------------------------------------------------------------------------
 1 | # Supporting local rules of EPUB files
 2 | 
 3 | EPUB files that generated by Re:VIEW (review-epubmaker) should be valid in eubcheck in IDPF.
 4 | 
 5 | But some e-book stores have their own rules, so they reject EPUB files by Re:VIEW.  To pass their rules, you can customize OPF file with config.yml.
 6 | 
 7 | ## EBPAJ EPUB 3 File Creation Guide
 8 | 
 9 | * http://ebpaj.jp/counsel/guide
10 | 
11 | EBPAJ, the Electronic Book Publishers Association of Japan, releases the guide for publishers to create EPUB files that make nothing of trouble in major EPUB readers.
12 | 
13 | To pass their guide, you can add some settings into config.yml:
14 | 
15 | ```yaml
16 | opf_prefix: {ebpaj: "http://www.ebpaj.jp/"}
17 | opf_meta: {"ebpaj:guide-version": "1.1.3"}
18 | ```
19 | 
20 | With this settings, Re:VIEW generates OPF files with epbaj attributes:
21 | 
22 | ```xml
23 | <package ... prefix="ebpaj: http://www.ebpaj.jp/">
24 |   ...
25 |     <meta property="ebpaj:guide-version">1.1.3</meta>
26 | ```
27 | 
28 | But EPUB files that Re:VIEW generates are not the same of name and structure to EBPAJ guide.
29 | 
30 | 
31 | ## iBookStore
32 | 
33 | Without special setting, iBooks has a margin between right page and left page in double-page spread.
34 | 
35 | To remove it, you can add some settings in config.yml.
36 | 
37 | ```yaml
38 | opf_prefix: {ibooks: "http://vocabulary.itunes.apple.com/rdf/ibooks/vocabulary-extensions-1.0/"}
39 | opf_meta: {"ibooks:binding": "false"}
40 | ```
41 | 
42 | If you have already some settings, merge them:
43 | 
44 | ```yaml
45 | opf_prefix: {ebpaj: "http://www.ebpaj.jp/", ibooks: "http://vocabulary.itunes.apple.com/rdf/ibooks/vocabulary-extensions-1.0/"}
46 | opf_meta: {"ebpaj:guide-version": "1.1.3", "ibooks:binding": "false"}
47 | ```
48 | 


--------------------------------------------------------------------------------
/doc/format_idg.ja.md:
--------------------------------------------------------------------------------
  1 | # Re:VIEW フォーマット InDesign XML 形式拡張
  2 | 
  3 | Re:VIEW フォーマットから、Adobe 社の DTP ソフトウェア「InDesign」で読み込んで利用しやすい XML 形式に変換できます (通常の XML とほぼ同じですが、文書構造ではなく見た目を指向した形態になっています)。実際には出力された XML を InDesign のスタイルに割り当てるフィルタをさらに作成・適用する必要があります。
  4 | 
  5 | 基本のフォーマットのほかにいくつかの拡張命令を追加しています。
  6 | 
  7 | このドキュメントは、Re:VIEW 2.0 に基づいています。
  8 | 
  9 | ## 追加したブロック
 10 | これらのブロックは基本的に特定の書籍向けのものであり、将来廃棄する可能性があります。
 11 | 
 12 | * `//insn[タイトル]{ 〜 //}` または `//box[タイトル]{ 〜 //}` : 書式
 13 | * `//planning{ 〜 //}` または `//planning[タイトル]{ 〜 //}` : プランニング
 14 | * `//best{ 〜 //}` または `//best[タイトル]{ 〜 //}` : ベストプラクティス
 15 | * `//security{ 〜 //}` または `//security[タイトル]{ 〜 //}` : セキュリティ
 16 | * `//expert{ 〜 //}`  : エキスパートに訊く
 17 | * `//point{ 〜 //}` または `//point[タイトル]{ 〜 //}` : ワンポイント
 18 | * `//shoot{ 〜 //}` または `//shoot[タイトル]{ 〜 //}` : トラブルシューティング
 19 | * `//term{ 〜 //}` : 用語解説
 20 | * `//link{ 〜 //}` または `//link[タイトル]{ 〜 //}` : 他の章やファイルなどへの参照説明
 21 | * `//practice{ 〜 //}` : 練習問題
 22 | * `//reference{ 〜 //}` : 参考情報
 23 | 
 24 | ## 相互参照
 25 | 
 26 | `//label[〜]` でラベルを定義し、`@<labelref>{〜}` で参照します。XML としては `<label id='〜' />` と `<labelref idref='〜' />` というタグに置き換えられます。
 27 | 
 28 | 実際にどのような相互参照関係にするかは、処理プログラムに依存します。想定の用途では、章や節の番号およびタイトルを記憶し、labelref の出現箇所に `「節（あるいは章）番号　タイトル」` という文字列を配置します。
 29 | 
 30 | `@<chapref>` の展開形式を、`--chapref="前装飾文字列,中間装飾文字列,後装飾文字列"` でコンパイル実行時に指定できます。デフォルトは`",「,」"`です。たとえば "`第2章「コンパイラ」`" のように普通は展開されます。`"「,　,」"`と指定すると、"`「第2章　コンパイラ」`" に展開されます。
 31 | 
 32 | ## 丸数字
 33 | 
 34 | `@<maru>{数値}` で丸数字を出力します。UTF-8 の丸数字を直接使うほうが適切です。
 35 | 
 36 | ## キートップ
 37 | 
 38 | `@<keytop>{キー文字}` でキーボードマークを出力します（実際のフォントとの割り当て処理はフィルタや review-ext.rb で調整します）。
 39 | 
 40 | ## 吹き出し
 41 | 
 42 | `@<balloon>{〜}` でコード内などでの吹き出しを作成します。通常、吹き出しは右に寄せられ、記入した箇所から吹き出しまで線が引かれます。
 43 | 
 44 | ## DTP 命令指定
 45 | 
 46 | `@<dtp>{ 〜 }` で「`<? dtp 〜 ?>`」という XML インストラクションを埋め込みます。処理系に渡す任意の文字列を指定できますが、次のような文字列を特殊文字指定できます。
 47 | 
 48 | * maru : 番号リストの各段落先頭で使い、このリスト段落の番号は丸数字であることを示す
 49 | * return  改行記号文字
 50 | * autopagenumber : 現ページ番号
 51 | * nextpageunmber : 次ページ番号
 52 | * previouspagenumber : 前ページ番号
 53 | * sectionmarker : セクションマーカー
 54 | * bulletcharacter : ビュレット (ナカグロ)
 55 | * copyrightsymbol : 著作権記号
 56 | * degreesymbol : 度記号
 57 | * ellipsischaracter : 省略記号
 58 | * forcedlinebreak : 強制改行
 59 | * discretionarylinebreak : 任意の改行
 60 | * paragraphsymbol : 段落記号
 61 | * registeredtrademark : 登録商標記号
 62 | * sectionsymbol : セクション記号
 63 | * trademarksymbol : 商標記号
 64 | * rightindenttab : 右インデントタブ
 65 | * indentheretab : 「ここまでインデント」タブ
 66 | * zerowidthnonjoiner : 結合なし
 67 | * emdash : EMダッシュ
 68 | * endash : ENダッシュ
 69 | * discretionaryhyphen : 任意ハイフン
 70 | * nonbreakinghyphen : 分散禁止ハイフン
 71 | * endnestedstyle : 先頭文字スタイルの終了文字
 72 | * doubleleftquote : 左二重引用符
 73 | * doublerightquote : 右二重引用符
 74 | * singleleftquote : 左用符
 75 | * singlerightquote : 右引用符
 76 | * singlestraightquote : 半角一重左用符
 77 | * doublestraightquote : 半角二重引用符
 78 | * emspace : EMスペース
 79 | * enspace : ENスペース
 80 | * flushspace : フラッシュスペース
 81 | * hairspace : 極細スペース
 82 | * nonbreakingspace : 分散禁止スペース
 83 | * fixedwidthnonbreakingspace : 分散禁止スペース（固定幅）
 84 | * textvariable : 全角スペース
 85 | * thinspace : 細いスペース
 86 | * figurespace : 数字の間隔
 87 | * punctuationspace : 句読点等の間隔
 88 | * sixthspace : 1/6スペース
 89 | * quarterspace : 1/4スペース
 90 | * thirdspace : 1/3スペース
 91 | * columnbreak : 改段
 92 | * framebreak : 改フレーム
 93 | * pagebreak : 改ページ
 94 | * oddpagebreak : 奇数改ページ
 95 | * evenpagebreak : 偶数改ページ
 96 | * footnotesymbol : 脚注記号
 97 | 
 98 | ## 表セル幅の指定
 99 | 
100 | `//tsize[1列目の幅,2列目の幅,...]` で、続く `//table` の表の列幅を指定します（単位mm）。これを利用するときには、`review compile --target=idgxml` を実行する際、オプション`--table=表幅` を付ける必要があります（表幅の単位は mm）。列幅指定の個数が実際の列数に満たない場合、残りの列は均等分割したものとなります。列幅の合計が表幅を超えると警告が表示されます。
101 | 
102 | ## 表セルの結合やスタイル指定
103 | `@<dtp>{table 表オプション}` を各セルに入れることで、そのセルの挙動を制御します。
104 | 
105 | 表オプションには次のものがあります。
106 | 
107 | * `colspan=列数` : 右方向に結合
108 | * `rowspan=行数` : 下方向に結合
109 | * `type=名前` : セルの種類の指定
110 | * `align=位置` : セル内の内容の位置。通常の用途では left|center|right のいずれか
111 | 


--------------------------------------------------------------------------------
/doc/makeindex.ja.md:
--------------------------------------------------------------------------------
 1 | # 索引の使い方
 2 | インラインタグ `@<idx>` および `@<hidx>` を用いて、索引単語を埋め込むことができます。索引を整列するにはその索引単語の「読み」が必要ですが、LaTeX ビルダにおいては、用意した辞書や形態素解析を使い、読み順に整列して紙面化します。
 3 | 
 4 | ## 注意
 5 | * LaTeX の mendex コマンドの実装に依存しているため、 現時点では英語または日本語以外の挙動は不明です。
 6 | * 形態素解析は、外部ソフトウェアの MeCab (http://taku910.github.io/mecab/)、その辞書である IPA 辞書、MeCab の Ruby バインドである mecab に依存しています。
 7 | * LaTeX ビルダ以外のビルダでは、埋め込んだ索引を利用する手法を提供していません。後述のヒントを参照してください。
 8 | * LaTeX ビルダでの索引生成機能は、デフォルトで無効にしています。設定 YAML ファイルで明示的に有効にする必要があります。
 9 | 
10 | ## MeCab のセットアップ
11 | 形態素解析による自動読みを使用する場合、MeCab  (http://taku910.github.io/mecab/) およびその辞書、Ruby バインドライブラリの mecab をインストールしておく必要があります。
12 | 
13 | Debian GNU/Linux あるいは Ubuntu の環境では、次のようにパッケージをインストールします。
14 | 
15 | ```
16 | apt install mecab mecab-ipadic-utf8 ruby-mecab
17 | ```
18 | 
19 | MeCab 標準の辞書としては IPA 辞書と Juman 辞書がありますが、本機能の自動読みのためには「-Oyomi」オプションがサポートされている必要があり、これに対応しているのは IPA 辞書のみです。
20 | 
21 | ## 設定
22 | review-pdfmaker での索引作成を有効にするため、config.yml (別の設定ファイルを使う場合はその YAML ファイル) に、次のように追加します。
23 | 
24 | ```
25 | pdfmaker:
26 |   makeindex: true
27 | ```
28 | 
29 | re ファイル内に、`@<idx>` または `@<hidx>` インラインタグを使って索引を埋め込みます。`@<idx>` は、指定の文字列をそのまま紙面に出力するとともに索引とします。`@<hidx>` (hidden index) は、指定の文字列を索引とするのみで、紙面には出力しません。`@<hidx>` の場合は文字列内を `<<>>` で区切り、`親索引語<<>>子索引語`、`親索引語<<>>子索引語<<>>孫索引語`  とレベル分けした索引を指定できます。
30 | 
31 | ```
32 | @<idx>{表示もする索引}です
33 |   ↓
34 | 表示もする索引です
35 | 
36 | [索引]
37 | ひ
38 | 表示もする索引です....1
39 | ```
40 | 
41 | ```
42 | @<hidx>{表示しない索引}です@<hidx>{親<<>>子}
43 |   ↓
44 | です
45 | 
46 | [索引]
47 | お
48 |  親
49 |    子................1
50 | 
51 | 
52 | ひ
53 |  表示もする索引です....1
54 | ```
55 | 
56 | ## 読み辞書
57 | 形態素解析は万能ではなく、特に短い単語は音読み・訓読みの違いで期待と異なる結果になりやすく、また辞書に載っていない専門的な単語は読みを解釈できずにおかしな結果になります。
58 | 
59 | 内部で使用している mendex プログラムに与える読み辞書を用意すれば、まずその辞書でのマッチングを試み、マッチングしなかったときに形態素解析を試みる、という手順をとることができます。また、MeCab を利用できない環境でも、すべての索引単語を解決できる読み辞書を用意すれば、索引機能を利用できます。
60 | 
61 | 辞書は次のように熟語と読みのペアをタブまたはスペースで区切ったテキストファイルとして作成します。
62 | 
63 | ```
64 | 漢字  かんじ
65 | 読み  よみ
66 | α    あるふぁ
67 | ```
68 | 
69 | このファイルを config.yml 設定ファイルで指定します (以下では my.dic を指定)。
70 | 
71 | ```
72 | pdfmaker:
73 |   makeindex: true
74 |   makeindex_dic: my.dic
75 | ```
76 | 
77 | なお、mendex のアルゴリズム上、辞書や形態素解析の適用は常にうまくいくとは限りません。たとえば「表 (ひょう、おもて)」のように 2 通りの読み方があるような語を使い分けたいというときには、review-pdfmaker のフック機能を使い、LaTeX のソースファイルに変換したところで LaTeX の索引命令に読みを明示する (たとえば `\index{おもて@表}`) といった対処が必要になるでしょう。LaTeX の索引命令の詳細については、mendex コマンドのオンラインマニュアルを参照してください。
78 | 
79 | ## カスタマイズ
80 | `pdfmaker:` 以下に記述可能な YAML 設定を以下にまとめます。
81 | 
82 | * `makeindex`: `true` で索引を作成 (デフォルト: `null`＝作成しない)
83 | * `makeindex_command`: 索引作成の支援コマンド (デフォルト: `mendex`)
84 | * `makeindex_options`: 支援コマンドのオプション (デフォルト: `-f -r -I utf8`)
85 | * `makeindex_sty`: 支援コマンドで使うスタイルファイル (デフォルト: `null`)
86 | * `makeindex_dic`: 支援コマンドで使う読み辞書ファイル (デフォルト: `null`)
87 | * `makeindex_mecab`: MeCab による形態素解析を試みる (デフォルト: `true`＝使用する)
88 | * `makeindex_mecab_opts`: MeCab で読みを取得するオプション (デフォルト: `-Oyomi`)
89 | 
90 | たとえば索引ページの見た目の表現は mendex コマンドのデフォルトのものが使われますが、設定をファイルで用意し、`makeindex_sty` にそのファイルを指定すれば変更できます。設定については mendex コマンドのオンラインマニュアルを参照してください。
91 | 
92 | ## ヒント
93 | 「注意」で述べたとおり、LaTeX ビルダ以外のビルダでそれを活用する方法は提供していません。というのも、ほかのビルダでは、索引を読み順に並べ替えたり、それを表現したりといった方法についての一般的な解が存在しないからです。
94 | 
95 | EPUB (HTML ビルダ) では `<!-- IDX:索引文字列 -->` のコメントで、IDGXML ビルダでは `<index value="索引文字列">` の XML 要素で、それぞれ索引は埋め込まれます。たとえばこれらを拾い出して、独自の辞書読み・整列ツール (LaTeX の mendex コマンドを流用するなど) を用意する方法が考えられるでしょう。
96 | 


--------------------------------------------------------------------------------
/doc/makeindex.md:
--------------------------------------------------------------------------------
 1 | # How to use index
 2 | You can embed an index with using inline tags `@<idx>` and `@<hidx>`. In order to sort the index containing Kanji, "syllabary" of the Kanji is necessary. LaTeX builder can sort and layout them using a dictionary or morphological analysis.
 3 | 
 4 | ## Notice
 5 | * Since it depends on mendex of LaTeX, it may work only in English or Japanese at present.
 6 | * Morphological analysis relies on external software MeCab (http://taku910.github.io/mecab/), IPA dictionary, and mecab Ruby binding.
 7 | * Other builders don't provide a method to use indexes. (see the hint.)
 8 | * The index generation is disabled by default. You have to explicitly enable in the onfiguration YAML file.
 9 | 
10 | ## Setting up MeCab
11 | When using morphological analytics, it is necessary to install MeCab (http://taku910.github.io/mecab/), its dictionary, and mecab of Ruby binding library.
12 | 
13 | On Debian GNU/Linux or Ubuntu:
14 | 
15 | ```
16 | apt install mecab mecab-ipadic-utf8 ruby-mecab
17 | ```
18 | 
19 | There are 2 standard dictionaries for MeCab, "IPA" and "Juman", but use "IPA". Because only IPA supports "-Oyomi" option.
20 | 
21 | ## Configuration
22 | To enable index generation in review-pdfmaker, add a configuration to config.yml.
23 | 
24 | ```
25 | pdfmaker:
26 |   makeindex: true
27 | ```
28 | 
29 | Embed the indexes in Re:VIEW re files using inline tags `@<idx>` or `@<hidx>`.
30 | `@<idx>` outputs the word and sets it as an index. `@<hidx>` (hidden index) only indexes the word (no output). By separating strings with `<<>>` in `@<hidx>`, like `parentindex<<>>childindex` or `parentindex<<>>childindex<<>>grandchildindex`, you can define a leveled index.
31 | 
32 | ```
33 | I @<idx>{display} it.
34 |   ↓
35 | I display it.
36 | 
37 | [Index]
38 | D
39 | display....1
40 | ```
41 | 
42 | ```
43 | I @<hidx>{display} it.@<hidx>{Country<<>>Japan}
44 |   ↓
45 | I it.
46 | 
47 | [Index]
48 | C
49 |  Country
50 |    Japan....1
51 | 
52 | 
53 | D
54 |  display....1
55 | ```
56 | 
57 | ## Dictionary for Kanji
58 | Morphological analysis is not a silver bullet. It frequently misreads.
59 | By providing a dictionary, mendex program will try to match the word with priority. Also even in environments where MeCab can't be used, you can use the index generation by using a dictionary to resolve Kanji words.
60 | 
61 | Dictionary file is a text file in which Kanji and Kana pairs are separated by tabs or spaces.
62 | 
63 | ```
64 | 漢字  かんじ
65 | 読み  よみ
66 | α    あるふぁ
67 | ```
68 | 
69 | Specify the above file (e.g. my.dic) in config.yml.
70 | 
71 | ```
72 | pdfmaker:
73 |   makeindex: true
74 |   makeindex_dic: my.dic
75 | ```
76 | 
77 | Due to mendex's algorithm, automatic Kanji sorting will not always succeed.
78 | In complicated case, you will need to modify a LaTeX source using review-pdfmaker's hook feature. See online manual of mendex for details.
79 | 
80 | ## Customize
81 | The following is an index setting that can be described under `pdfmaker:` in config.yml.
82 | 
83 | * `makeindex`: if `true`, generate index page (default: `null` = don't generate)
84 | * `makeindex_command`: command path of the index tool (default: `mendex`)
85 | * `makeindex_options`: options of the index tool (default: `-f -r -I utf8`)
86 | * `makeindex_sty`: style file path of the index tool (default: `null`)
87 | * `makeindex_dic`: dictionary file path of the index tool (default: `null`)
88 | * `makeindex_mecab`: use MeCab (default: `true` = yes, I use)
89 | * `makeindex_mecab_opts`: options of MeCab (default: `-Oyomi`)
90 | 
91 | For example, if you want to change the appearance of the index page, specify the style file to `makeindex_sty`. See online manual of mendex for details.
92 | 
93 | ## Hint
94 | The builders other than LaTeX builder don't provide a method to use indexes. Because the targets of other builders don't have a general way of sorting or outputting indexes.
95 | 
96 | In EPUB (HTML builder), the index is embeded as `<!-- IDX:indexword -->` comment. In IDGXML builder, it is embeded as `<index value="indexword">` XML element.
97 | You can probably pick up them and prepare your own tool to sort (by using LaTeX mendex command, e.g.) and output.
98 | 


--------------------------------------------------------------------------------
/doc/pdfmaker.ja.md:
--------------------------------------------------------------------------------
 1 | # LaTeX と review-pdfmaker について
 2 | Re:VIEW の review-pdfmaker は、フリーソフトウェアの簡易 DTP システム「LaTeX」を呼び出して PDF を作成しています。
 3 | 
 4 | そのため、利用にあたっては TeX の環境を別途セットアップしておく必要があります。OS に応じたセットアップについては、以下の TeX Wiki サイトなどを参照してください。
 5 | 
 6 | #### TeX Wiki - TeX入手法
 7 | * https://texwiki.texjp.org/?TeX入手法
 8 | 
 9 | ## Re:VIEW バージョンによる変化についての注意
10 | * Re:VIEW 2.0 より、LaTeX コンパイラのデフォルトが pLaTeX から upLaTeX になりました。以下の「upLaTeX について」を参照してください。
11 | * Re:VIEW 2.0 より、image タグに `scale` オプションを使って倍率数値を定義していた場合の挙動が変わりました。以下の「scale オプションの挙動について」を参照してください。
12 | * Re:VIEW 2.0 より、config.yml 等の設定ファイルで使われる `prt` のデフォルトが「発行所」ではなく「印刷所」になりました。「発行所」には `pbl` のほうをお使いください。
13 | 
14 | ## upLaTeX について
15 | 
16 | 2016年4月リリースの Re:VIEW 2.0 より、LaTeX のコンパイラのデフォルトが、「pLaTeX」から「upLaTeX」に切り替わりました。upLaTeX は pLaTeX の内部文字処理を Unicode 対応にしたもので、丸数字（①②…）のように pLaTeXでは otf パッケージが必要だった文字、あるいは韓国語や中国語との混植などを、直接扱うことができます。
17 | 
18 | ほとんどの pLaTeX 向けのパッケージはそのまま動作しますが、jsbook クラスや otf パッケージなどでは uplatex オプションが必要です。
19 | 
20 | LaTeX コンパイラコマンドおよびオプションについて、Re:VIEW の設定のデフォルトは次のとおりです。
21 | 
22 | ```yaml
23 | texcommand: uplatex
24 | texoptions: null
25 | texdocumentclass: ["jsbook", "uplatex,oneside"]
26 | dvicommand: dvipdfmx
27 | dvioptions: "-d 5"
28 | ```
29 | 
30 | ## 旧来の pLaTeX を使用するには
31 | 
32 | 既存のドキュメントについて、利用しているマクロやパッケージが upLaTeX でうまく動かない、あるいはこれまでと異なる紙面ができてしまう場合は、pLaTeX に戻したいと思うかもしれません。
33 | 
34 | Re:VIEW 2.0 よりも前のバージョンと同じコンパイラ設定に戻すには、config.yml に次のように記述します。
35 | 
36 | ```yaml
37 | texcommand: platex
38 | texoptions: "-kanji=utf-8"
39 | texdocumentclass: ["jsbook", "oneside"]
40 | dvicommand: dvipdfmx
41 | dvioptions: "-d 5"
42 | ```
43 | 
44 | レイアウト erb ファイル（デフォルトは lib/review/layout.tex.erb）において、upLaTeX と pLaTeX の区別は内部変数 texcompiler で行えます。変数 texcompiler には、パラメータ texcommand の値からフォルダパスとファイル拡張子を除いたものが入っており、pLaTeX の場合は "platex"、upLaTeX の場合は "uplatex" となります。使用例は次のとおりです。
45 | 
46 | ```
47 | <% if texcompiler == "uplatex" %>
48 | \usepackage[deluxe,uplatex]{otf}
49 | <% else %>
50 | \usepackage[deluxe]{otf}
51 | <% end %>
52 | ```
53 | 
54 | ## scale オプションの挙動について
55 | Re:VIEW 2.0 より、``//image`` タグの第3オプションに ``scale=倍率`` で数値のみで倍率を指定していたときの挙動が変わりました。以前は「画像ファイルに対する倍率」でしたが、「紙面横幅に対する倍率」となります（もともと数値以外の文字も scale の値に含めていた場合には、変化はありません）。
56 | 
57 | 旧来の「画像ファイルに対する倍率」に戻したいときには、config.yml にパラメータ ``image_scale2width: false`` を指定してください（デフォルトは true）。
58 | 
59 | ```yaml
60 | image_scale2width: false
61 | ```
62 | 


--------------------------------------------------------------------------------
/doc/pdfmaker.md:
--------------------------------------------------------------------------------
 1 | # LaTeX and review-pdfmaker
 2 | 
 3 | The command `review-pdfmaker` in Re:VIEW use [LaTeX](https://en.wikipedia.org/wiki/LaTeX) to generate a PDF file.
 4 | 
 5 | To use the command, you need to set up LaTeX system.
 6 | 
 7 | 
 8 | ## Important Changes about LaTeX in Re:VIEW 2.0
 9 | 
10 | * Default LaTeX compiler is upLaTeX, not pLaTeX.
11 | * The meaning of `scale` option in `@<image>` command is changed and configurable.
12 | * `prt` is printer, not publisher. You can use `pbl` for publisher.
13 | 
14 | ## about upLaTeX
15 | 
16 | In Re:VIEW 2.0 released at April 2016, default LaTeX compiler became upLaTeX from pLaTeX.  The upLaTeX support Unicode and you can use unicode characters such like ①②... and other characters without otf package.
17 | 
18 | Almost packages in pLaTeX can be supported in upLaTeX, but some package (such as jsbook class and otf package) need `uplatex` option.
19 | 
20 | Default settings of Re:VIEW is below:
21 | 
22 | ```yaml
23 | texcommand: uplatex
24 | texoptions: null
25 | texdocumentclass: ["jsbook", "uplatex,oneside"]
26 | dvicommand: dvipdfmx
27 | dvioptions: "-d 5"
28 | ```
29 | 
30 | ## How to use old pLaTeX
31 | 
32 | You also use pLaTeX with Re:VIEW 2.0.
33 | 
34 | To use pLaTeX, You can add these configuration in config.yml.
35 | 
36 | ```yaml
37 | texcommand: platex
38 | texoptions: "-kanji=utf-8"
39 | texdocumentclass: ["jsbook", "oneside"]
40 | dvicommand: dvipdfmx
41 | dvioptions: "-d 5"
42 | ```
43 | 
44 | You can use a variable `@texcompiler` to compare latex command in layout ERB files (lib/review/layout.tex.erb in default).
45 | The value of `@texcompiler` is `platex` (when using pLaTeX) and `uplatex` (when using upLaTeX).
46 | The usage is below:
47 | 
48 | ```
49 | <% if @texcompiler == "uplatex" %>
50 | \usepackage[deluxe,uplatex]{otf}
51 | <% else %>
52 | \usepackage[deluxe]{otf}
53 | <% end %>
54 | ```
55 | 
56 | ## about `scale` option
57 | 
58 | In Re:VIEW 2.0, the meaning of `scale=..` in the third option of ``//image`` command.
59 | The meaning in 1.0 is "scale for image file" (`1.0` is same as original image size), but the one in 2.0 is "scale for paper width" (`1.0` is same as paper widdth.)
60 | 
61 | If you need the same behavior in Re:VIEW 1.x, you should add ``image_scale2width: false`` in config.yml (default value is `true`).
62 | 
63 | ```yaml
64 | image_scale2width: false
65 | ```
66 | 


--------------------------------------------------------------------------------
/doc/preproc.ja.md:
--------------------------------------------------------------------------------
  1 | # review-preproc ユーザガイド
  2 | 
  3 | Re:VIEWではソースコードなどを本文中に埋め込むことができます。
  4 | 
  5 | ## `#@mapfile`
  6 | 
  7 | 以下は`scripts/hello.rb`のソースを本文内に埋め込んでいます。
  8 | 
  9 | ```review
 10 | //list[hello.rb][hello.rb]{
 11 | #@mapfile(scripts/hello.rb)
 12 | #!/usr/bin/env ruby
 13 | 
 14 | class Hello
 15 |   def hello(name)
 16 |     print "hello, #{name}!\n"
 17 |   end
 18 | end
 19 | 
 20 | if __FILE__ == $0
 21 |   Hello.new.hello("world")
 22 | end
 23 | #@end
 24 | //}
 25 | ```
 26 | 「`#@mapfile(ファイル名)`」から「`#@end`」は、指定したファイル名のファイル全体を本文中に埋め込むための記法です。埋め込む際には、`review-preproc`コマンドを実行します。
 27 | 
 28 | まず、以下のように、引用したい部分に「`#@mapfile()`」と「`#@end`」だけを書きます。ここでは`//list`ブロック内にこの２行だけを記述しています。
 29 | 
 30 | ```review
 31 | //list[hello.rb.1][hello.re]{
 32 | #@mapfile(scripts/hello.rb)
 33 | #@end
 34 | //}
 35 | ```
 36 | このソースに対して、`review-preproc`コマンドを実行します。すると、変換結果の*.reファイルを標準出力に出力します。
 37 | 
 38 | ```shell-session
 39 | $ review-preproc hello.re
 40 | ```
 41 | `--replace`オプションをつければ、ファイルそのものを置き換えるようになります。
 42 | 
 43 | ```shell-session
 44 | $ review-preproc --replace hello.re
 45 | ```
 46 | 
 47 | なお、rakeを使ってビルドしている場合、Rakefileに以下のような記述を追加すると、このコマンドを実行するtaskが定義されます。
 48 | 
 49 | ```rake
 50 | desc 'preproc all'
 51 | task :preproc do
 52 |   Dir.glob("*.re").each do |file|
 53 |     sh "review-preproc --replace #{file}"
 54 |   end
 55 | end
 56 | ```
 57 | 
 58 | 以下のように実行すれば、コマンドが実行されます。
 59 | 
 60 | ```shell-session
 61 | $ rake preproc
 62 | ```
 63 | 
 64 | ## `#@maprange`
 65 | 
 66 | 対象ファイルの一部だけ抜粋することもできます。こちらは「`#@maprange`」という記法を使います。
 67 | 
 68 | 対象ファイルの抜粋したい部分の前後に、「`#@range_begin(ID)`」と「`#@range_end`」という記法を埋め込んでおきます。`#@range_begin`の引数には、その断片を抽出する際に使用するIDを指定します。以下の例では「sample」というIDにしています。
 69 | 
 70 | ```ruby
 71 | #!/usr/bin/env ruby
 72 | 
 73 | class Hello
 74 | #@range_begin(sample)
 75 |   def hello(name)
 76 |     print "hello, #{name}!\n"
 77 |   end
 78 | #@range_end(sample)
 79 | end
 80 | 
 81 | if __FILE__ == $0
 82 |   Hello.new.hello("world")
 83 | end
 84 | ```
 85 | *.reファイルの方には、「`#@mapfile(ファイル名)`」ではなく「`#@maprange(ファイル名,ID)`」を記述します。
 86 | 
 87 | ```review
 88 | //list[range.rb][range.rb(抜粋)]{
 89 | #@maprange(scripts/range.rb,sample)
 90 | #@end
 91 | //}
 92 | ```
 93 | 
 94 | あとは、先ほど同様、`review-preproc`コマンドか`rake preproc`コマンドを実行します。そうすると、`scripts/range.rb`の一部が抽出されて埋め込まれます。
 95 | 
 96 | ```review
 97 | //list[range.rb][range.rb(抜粋)]{
 98 | #@maprange(scripts/range.rb,sample)
 99 |   def hello(name)
100 |     print "hello, #{name}!\n"
101 |   end
102 | #@end
103 | //}
104 | ```
105 | 
106 | ## `#@@maprange`
107 | 
108 | もっとも、Ruby以外では「`#@range_begin`」などがコメントと解釈されないこともあります。そのような場合、その言語のコメントの中に「`#@@range_begin`」と「`#@@range_end`」とを記述します。
109 | 
110 | Cのソースを例にします。対象となるrange.cは以下です。
111 | 
112 | ```c
113 | #include <stdio.h>
114 | 
115 | /* #@@range_begin(sample)  */
116 | void
117 | put_hello(char *name)
118 | {
119 |   printf("hello, %s!\n", name);
120 | }
121 | /* #@@range_end(sample) */
122 | 
123 | int main()
124 | {
125 |   put_hello("world");
126 | }
127 | ```
128 | 
129 | put_hello関数の定義の前後で「`#@@range_begin`」と「`#@@range_end`」が使われています。
130 | 
131 | これに対し、*.reファイルでは`#@maprange(scripts/range.c,sample)`と`#@end`を記述します。
132 | 
133 | ```
134 | //list[range.c][range.c(抜粋)]{
135 | #@maprange(scripts/range.c,sample)
136 | #@end
137 | //}
138 | ```
139 | 
140 | 変換した結果、以下のようになります。
141 | 
142 | ```
143 | //list[range.c][range.c(抜粋)]{
144 | #@maprange(scripts/range.c,sample)
145 | void
146 | put_hello(char *name)
147 | {
148 |   printf("hello, %s!\n", name);
149 | }
150 | #@end
151 | //}
152 | ```
153 | このようにすると、Cなどの言語のファイルに対しても、ソースの一部を抽出して埋め込むことができます。
154 | 


--------------------------------------------------------------------------------
/doc/preproc.md:
--------------------------------------------------------------------------------
  1 | # `review-preproc` User Guide
  2 | 
  3 | Re:VIEW has a preprocessor, `review-preproc`.  It can embed a (part of) file into *.re files.
  4 | 
  5 | ## `#@mapfile`
  6 | 
  7 | The code below is a sample of embedding code from `scripts/hello.rb`.
  8 | 
  9 | ```review
 10 | //list[hello.rb][hello.rb]{
 11 | #@mapfile(scripts/hello.rb)
 12 | #!/usr/bin/env ruby
 13 | 
 14 | class Hello
 15 |   def hello(name)
 16 |     print "hello, #{name}!\n"
 17 |   end
 18 | end
 19 | 
 20 | if __FILE__ == $0
 21 |   Hello.new.hello("world")
 22 | end
 23 | #@end
 24 |  //}
 25 | ```
 26 | 
 27 | `#@mapfile(filename)` and `#@end` are markers for preprocessor.  You can embed and update the content of the file `filename` into Re:VIEW file with `review-preproc` command.
 28 | 
 29 | First, add `#@mapfile()` and `#@end` on the document.
 30 | 
 31 | ```review
 32 | //list[hello.rb.1][hello.re]{
 33 | #@mapfile(scripts/hello.rb)
 34 | #@end
 35 | //}
 36 | ```
 37 | 
 38 | Then execute `review-preproc` command.  The command display the result on stdout.
 39 | 
 40 | ```shell-session
 41 | $ review-preproc hello.re
 42 | ```
 43 | 
 44 | With `--replace` option, `review-preproc` replaces the Re:VIEW file.
 45 | 
 46 | ```shell-session
 47 | $ review-preproc --replace hello.re
 48 | ```
 49 | 
 50 | If you use `rake` to build Re:VIEW document, you can add the code to Rakefile to define a task of `review-preproc`.
 51 | 
 52 | ```rake
 53 | desc 'preproc all'
 54 | task :preproc do
 55 |   Dir.glob("*.re").each do |file|
 56 |     sh "review-preproc --replace #{file}"
 57 |   end
 58 | end
 59 | ```
 60 | 
 61 | Then, you can execute preprocessor with `rake`.
 62 | 
 63 | ```shell-session
 64 | $ rake preproc
 65 | ```
 66 | 
 67 | ## `#@maprange`
 68 | 
 69 | You also can embed a part of the target file with `#@maprange` marker.
 70 | 
 71 | Add `#@range_begin(ID)` and `#@range_end` in the target file you want to embed.
 72 | In `#@range_begin(ID)`, you must add ID as parameger to identify the part.
 73 | 
 74 | In the code below, `sample` is the ID of the range to embed.
 75 | 
 76 | ```ruby
 77 | #!/usr/bin/env ruby
 78 | 
 79 | class Hello
 80 | #@range_begin(sample)
 81 |   def hello(name)
 82 |     print "hello, #{name}!\n"
 83 |   end
 84 | #@range_end(sample)
 85 | end
 86 | 
 87 | if __FILE__ == $0
 88 |   Hello.new.hello("world")
 89 | end
 90 | ```
 91 | 
 92 | In *.re file, add `#@maprange(filename,ID)`, instead of `#@mapfile(filename)`, and `#@end`.
 93 | 
 94 | ```review
 95 | //list[range.rb][range.rb(partial)]{
 96 | #@maprange(scripts/range.rb,sample)
 97 | #@end
 98 | //}
 99 | ```
100 | 
101 | After that, execute `review-preproc` or `rake preproc`, and you get the *.re files embedded the `hello` method in `scripts/range.rb`.
102 | 
103 | ```review
104 | //list[range.rb][range.rb(partial)]{
105 | #@maprange(scripts/range.rb,sample)
106 |   def hello(name)
107 |     print "hello, #{name}!\n"
108 |   end
109 | #@end
110 |  //}
111 | ```
112 | 
113 | ## `#@@maprange`
114 | 
115 | But in some language, a line `#@range_begin` is not a comment.  If you want to embed some code of such languages, you can use new markers `#@@range_begin` and `#@@range_end` into a comment in the target document.
116 | 
117 | Let's explain how to do.  A target file `range.c` is below:
118 | 
119 | ```c
120 | #include <stdio.h>
121 | 
122 | /* #@@range_begin(sample)  */
123 | void
124 | put_hello(char *name)
125 | {
126 |   printf("hello, %s!\n", name);
127 | }
128 | /* #@@range_end(sample) */
129 | 
130 | int main()
131 | {
132 |   put_hello("world");
133 | }
134 | ```
135 | 
136 | There are markers `#@@range_begin` and `#@@range_end` around `put_hello` method.
137 | 
138 | In `*.re`, add `#@maprange(scripts/range.c,sample)` and `#@end`.
139 | 
140 | 
141 | ```
142 | //list[range.c][range.c(抜粋)]{
143 | #@maprange(scripts/range.c,sample)
144 | #@end
145 | //}
146 | ```
147 | 
148 | With `review-preproc`, we get the result of conversion like below:
149 | 
150 | ```
151 | //list[range.c][range.c(抜粋)]{
152 | #@maprange(scripts/range.c,sample)
153 | void
154 | put_hello(char *name)
155 | {
156 |   printf("hello, %s!\n", name);
157 | }
158 | #@end
159 | //}
160 | ```
161 | 


--------------------------------------------------------------------------------
/doc/quickstart.ja.md:
--------------------------------------------------------------------------------
  1 | # Re:VIEWクイックスタートガイド
  2 | 
  3 | Re:VIEW は、EWB や RD あるいは Wiki に似た簡易フォーマットで記述したテキストファイルを、目的に応じて各種の形式に変換するツールセットです。
  4 | 
  5 | 平易な文法ながらも、コンピュータ関係のドキュメント作成のための多くの機能を備えており、テキスト、LaTeX、HTML、XML といった形式に変換できます。独自のカスタマイズも簡単です。
  6 | 
  7 | Re:VIEW は GNU Lesser General Public License Version 2.1 に基づいて配布されており、自由に利用、改変、再配布できます。このライセンスは、Re:VIEW を使ってあなたが作成しようとする文書とは無関係であり、あなたの文書はこのライセンスに強制されることはありません。Re:VIEW のツールセットあるいは Re:VIEW を組み込んだシステムを配布あるいは販売しようとしているときには、ライセンスファイル COPYING をよく確認してください。
  8 | 
  9 | このドキュメントでは、Re:VIEW のセットアップから変換の例までを簡単に説明します。
 10 | 
 11 | このドキュメントは、Re:VIEW 2.0 に基づいています。
 12 | 
 13 | ## セットアップ
 14 | 
 15 | Re:VIEW は Ruby 言語で記述されており、Linux/Unix 互換システムで動作します。Mac OS X および Windows Cygwin でも動作可能です。Ruby gem あるいは Git のいずれかを使ってダウンロード・展開します。
 16 | 
 17 | なお、Re:VIEW フォーマット自体は文字で表現されたタグが付いている以外は単なるテキストファイルなので、エディタ、OS については UTF-8 文字エンコーディングさえ使用できれば制限はありません。
 18 | 
 19 | ### RubyGems を使う場合
 20 | 
 21 | 機能セットがまとまった区切りごとに、定期的に Re:VIEW の開発チームが Re:VIEW の gem を更新しています。
 22 | 
 23 | 次のように Re:VIEW の gem をインストールします。
 24 | 
 25 | ```bash
 26 | $ gem install review
 27 | ```
 28 | 
 29 | Ruby gem の bin ディレクトリにパスを通すようにしておいてください。
 30 | 
 31 | インストール後、最新の gem に追従するには次のようにします。
 32 | 
 33 | ```bash
 34 | $ gem update review
 35 | ```
 36 | 
 37 | Gemfile を使っている場合は、以下の行を Gemfile に追加して、`bundle`コマンドを実行します。
 38 | 
 39 | ```Gemfile
 40 | gem 'review'
 41 | ```
 42 | 
 43 | ### Gitを使う場合
 44 | 
 45 | Re:VIEW は GitHub で開発されており、バージョン管理ツールの Git を使って最新の Re:VIEW コードを入手できます。Git は分岐が容易なので、独自のカスタマイズを施すのにも向いています。
 46 | 
 47 | 初めて取得するときには、次のようにします (コピーを作っています)。
 48 | 
 49 | ```bash
 50 | $ git clone https://github.com/kmuto/review.git
 51 | ```
 52 | 
 53 | review というディレクトリに展開されるので、review/bin にパスを通すようにしておいてください。
 54 | 
 55 | 最新の開発に追従するには次のようにします。
 56 | 
 57 | ```bash
 58 | $ git pull
 59 | ```
 60 | 
 61 | ## Re:VIEW ドキュメントの作成
 62 | 
 63 | ### 雛型の作成
 64 | review-init コマンドを使って、雛型となる作業フォルダを作成できます。
 65 | 
 66 | ```
 67 | $ review-init ドキュメント名
 68 | ```
 69 | 
 70 | これで指定のドキュメント名のフォルダが用意され、中に次のようなファイルが置かれます。
 71 | 
 72 |  * ドキュメント名を冠した「.re」拡張子を持つファイル（Re:VIEW フォーマットテキストファイル）
 73 |  * config.yml : 設定ファイル
 74 |  * catalog.yml : カタログファイル（目次構成）
 75 |  * Rakefile : rake コマンドのルールファイル
 76 |  * images : 画像の配置フォルダ
 77 |  * layouts : レイアウトファイルの配置フォルダ
 78 |  * style.css : サンプルスタイルシート
 79 |  * sty : スタイルファイル配置フォルダ（TeX 用）
 80 | 
 81 | review-init コマンドによらず、独自に作業フォルダを作成してもかまいません。
 82 | 
 83 | ### Re:VIEW テキストの作成と変換
 84 | 
 85 | デフォルトの re 拡張子のファイルは、「`=`」とあるだけのほぼ空っぽのファイルです。次に Re:VIEW フォーマットで記述を追加した簡単な例を示します。
 86 | 
 87 | ```review
 88 | = はじめてのRe:VIEW
 89 | 
 90 | //lead{
 91 | 「Hello, Re:VIEW.」
 92 | //}
 93 | 
 94 | == Re:VIEWとは
 95 | 
 96 | @<b>{Re:VIEW}は、EWBやRDあるいはWikiに似た簡易フォーマットで記述したテキストファイルを、目的に応じて各種の形式に変換するツールセットです。
 97 | 
 98 | 平易な文法ながらも、コンピュータ関係のドキュメント作成のための多くの機能を備えており、次のような形式に変換できます。
 99 | 
100 |  * テキスト（指示タグ付き）
101 |  * LaTeX
102 |  * HTML
103 |  * XML
104 | 
105 | 現在入手手段としては次の3つがあります。
106 | 
107 |  1. Ruby gem
108 |  2. Git
109 |  3. Download from GitHub
110 | 
111 | ホームページは@<tt>{https://reviewml.org/}です。
112 | ```
113 | 
114 | テキストファイルの文字エンコーディングには、UTF-8 を使用してください。
115 | 
116 | ### PDF 化と EPUB 化、プレインテキスト化
117 | 
118 | review-pdfmaker コマンドで PDF ブックの作成、review-epubmaker コマンドで EPUB ファイルの作成、review-textmaker コマンドでプレインテキストの作成ができます。
119 | 
120 | PDF を作成するには、TeXLive2012 以上の環境が必要です。EPUB を作成するには、rubyzip gem あるいは zip コマンドが必要です（MathML も使いたいときには、 [MathML ライブラリ](http://www.hinet.mydns.jp/?mathml.rb)も必要です）。
121 | 
122 | いずれのコマンドも、必要な設定情報を記した YAML 形式ファイルを引数に指定して実行します。review-init コマンドで作成した環境には、デフォルトで config.yml として用意されているので、これを利用します。
123 | 
124 | ```bash
125 | $ review-pdfmaker config.yml     ←PDFの作成
126 | $ review-epubmaker config.yml    ←EPUBの作成
127 | $ review-textmaker config.yml    ←テキストの作成（装飾情報あり）
128 | $ review-textmaker -n config.yml ←テキストの作成（装飾情報なし）
129 | ```
130 | 
131 | rake コマンドを利用できるなら、次のように実行することもできます。
132 | 
133 | ```bash
134 | $ rake pdf  ←PDFの作成
135 | $ rake epub ←EPUBの作成
136 | $ rake text  ←テキストの作成（装飾情報あり）
137 | $ rake plaintext ←テキストの作成（装飾情報なし）
138 | ```
139 | 
140 | config.yml のサンプルについては以下を参照してください。
141 | 
142 | * [config.yml.sample](https://github.com/kmuto/review/blob/master/doc/config.yml.sample)
143 | 
144 | ### 章を増やす、カスタマイズする
145 | 作成した PDF あるいは EPUB を見ると、先に作成した RE:VIEW フォーマットテキストファイルが「第1章」となっていることがわかります。
146 | 
147 | 章を増やすには、同様に .re 拡張子の Re:VIEW フォーマットテキストファイルを用意し、catalog.yml にそれを登録します。
148 | 
149 | ```
150 | PREDEF:
151 | 
152 | CHAPS:
153 |   - 1章のファイル
154 |   - 2章のファイル
155 |    ……
156 | 
157 | APPENDIX:
158 | 
159 | POSTDEF:
160 | ```
161 | 
162 | catalog.yml の PREDEF は前付、CHAPS は章、APPENDIX は付録、POSTDEF は後付です。詳細は [catalog.ja.md](https://github.com/kmuto/review/blob/master/doc/catalog.ja.md) を参照してください。
163 | 
164 | ### 情報
165 | Re:VIEW フォーマットについての詳細は、 [format.ja.md](https://github.com/kmuto/review/blob/master/doc/format.ja.md) を参照してください。
166 | 
167 | Re:VIEW の使用実例については、https://github.com/reviewml/review-samples にもまとめています。
168 | 
169 | ## ファイル単位の変換
170 | 通常の用途では review-pdfmaker や review-epubmaker で事足りるはずですが、それ以外の形式に変換したり、PDF や EPUB の変換にあたってどのような変換が行われているのかを確認したりしたいときには、review-compile コマンドを使用します。
171 | 
172 | たとえば sample.re ファイルを変換するには次のようになります。
173 | 
174 | ```bash
175 | $ review-compile --target text sample.re > sample.txt    ←テキストにする
176 | $ review-compile --target html sample.re > sample.html   ←HTMLにする
177 | $ review-compile --target latex sample.re > sample.tex   ←LaTeXにする
178 | $ review-compile --target idgxml sample.re > sample.xml  ←XMLにする
179 | $ review-compile --target markdown sample.re > sample.md ←Markdownにする
180 | ```
181 | 
182 | review-compile を含め、ほとんどのコマンドは `--help` オプションを付けるとオプションについてのヘルプが表示されます。
183 | 
184 | ## プリプロセッサ、ボリューム表示
185 | 
186 | `#@mapfile`、`#@maprange`、`#@mapoutput` のタグを使って、指定のファイルの内容あるいはコマンドの実行結果を挿入できます。挿入・更新を行うには、プリプロセッサとなる review-preproc コマンドを使います。
187 | 
188 | ```bash
189 | $ review-preproc ファイル > 結果ファイル ←標準出力をリダイレクト
190 | 
191 | ## または
192 | $ review-preproc --replace ファイル ←ファイルを更新したもので上書き
193 | ```
194 | 
195 | 各章の分量などを表示するには、review-vol コマンドを使います。
196 | 
197 | ```bash
198 | $ review-vol
199 | ```
200 | 
201 | より細かな見出し一覧などを出したいときには、review-index コマンドを使うのもよいでしょう。
202 | 
203 | ```bash
204 | $ review-index --level 掘り下げる見出しレベル数 -a
205 | ```
206 | 
207 | ## クレジット
208 | 
209 | Re:VIEW は、青木峰郎によって最初に作成されました。武藤健志がこの開発・保守を引き継ぎ、2016年4月時点では、武藤健志、高橋征義、角征典が開発・保守を継続しています。
210 | 
211 | バグ・パッチの報告、開発者用メーリングリストなどについての情報は、
212 | 
213 | * http://reviewml.org/
214 | * https://github.com/kmuto/review/wiki
215 | 
216 | を参照してください。
217 | 


--------------------------------------------------------------------------------
/doc/quickstart.md:
--------------------------------------------------------------------------------
  1 | # Re:VIEW Quick Start Guide
  2 | 
  3 | Re:VIEW is a toolset to convert from Re:VIEW format documents into various formats.
  4 | 
  5 | Re:VIEW uses original lightweight markup language like EWB, RD or Wiki.  Its syntax is simple but powerful for writing IT documents.
  6 | When you write your documents in Re:VIEW format, you can convert them with Re:VIEW tools into LaTeX, HTML, EPUB, InDesign, Text, and so on.
  7 | 
  8 | Re:VIEW is free software under the terms of the GNU Lesser General Public License Version 2.1, so you can use, modify and redistribute it. This license has no relations with your documents using Re:VIEW, so your documents are not forced to use this license. When you want to distribute Re:VIEW software itself or the system including Re:VIEW software, you should read COPYING file carefully.
  9 | 
 10 | This article describes how to setup Re:VIEW and use it.
 11 | 
 12 | The supported version of the article is Re:VIEW 2.0.
 13 | 
 14 | ## Set up Re:VIEW
 15 | 
 16 | Re:VIEW is a software in Ruby and worked in Linux/Unix, Mac OS X, and Windows. You can install Re:VIEW with RubyGems or Git.
 17 | 
 18 | Note that Re:VIEW format is plain texts with simple markups in UTF-8, so you can write it on any editors and OSes.
 19 | 
 20 | ### using RubyGmes
 21 | 
 22 | Re:VIEW is released as RubyGems.
 23 | 
 24 | * https://rubygems.org/gems/review
 25 | 
 26 | Add this line to your application's Gemfile:
 27 | 
 28 | ```Gemfile
 29 | gem 'review'
 30 | ```
 31 | 
 32 | And then execute:
 33 | 
 34 | ```
 35 | $ bundle
 36 | ```
 37 | 
 38 | Or install it yourself as:
 39 | 
 40 | ```bash
 41 | $ gem install review
 42 | ```
 43 | 
 44 | ### using Git
 45 | 
 46 | You can get latest Re:VIEW sources from GitHub.
 47 | 
 48 | ```bash
 49 | $ git clone https://github.com/kmuto/review.git
 50 | ```
 51 | 
 52 | You can use Re:VIEW to add `review/bin` directory to `$PATH` variable.
 53 | 
 54 | You can update the sources as follows:
 55 | 
 56 | ```bash
 57 | $ git pull
 58 | ```
 59 | 
 60 | ## Writing Re:VIEW Document
 61 | 
 62 | ### Generating template fiels
 63 | 
 64 | After setup, you can use `review-init` command to generate Re:VIEW project directory.
 65 | 
 66 | To generate `hello` project:
 67 | 
 68 | ```bash
 69 | $ review-init hello
 70 | $ cd hello
 71 | $ ls hello
 72 | Rakefile     catalog.yml  config.yml   hello.re     images/      layouts/     sty/         style.css
 73 | ```
 74 | 
 75 | In `hello` directory, many files are generated.
 76 | 
 77 | * `*.re` : Re:VIEW format file.
 78 | * config.yml : configuration file
 79 | * catalog.yml : catalog file (for TOC)
 80 | * Rakefile : rule file for `rake` command
 81 | * images : folder for images
 82 | * layouts : forlder for layout files
 83 | * style.css : sample stylesheet
 84 | * sty : style files for LaTeX
 85 | 
 86 | 
 87 | ### writing Re:VIEW documents and converting them
 88 | 
 89 | ```review
 90 | = My First Re:VIEW
 91 | 
 92 | //lead{
 93 | "Hello, Re:VIEW."
 94 | //}
 95 | 
 96 | == What's Re:VIEW
 97 | 
 98 | @<b>{Re:VIEW} is a converter from simple markup documents into various formats.
 99 | 
100 | You can generate documents as follows:
101 | 
102 |  * text with tagging
103 |  * LaTeX
104 |  * HTML
105 |  * XML
106 | 
107 | You can install Re:VIEW with:
108 | 
109 |  1. RubyGems
110 |  2. Git
111 |  3. Download from GitHub
112 | 
113 | The web site of Re:VIEW is @<tt>{https://reviewml.org/}.
114 | ```
115 | 
116 | You should use UTF-8 as encodings in text files.
117 | 
118 | ### generating PDF, EPUB, and plain-text
119 | 
120 | You can generate a PDF file with `review-pdfmaker` command.  Also you can generate an EPUB file with `review-epubmaker` command, and can generate an plain-text file with 'review-textmaker' command.
121 | 
122 | To generate PDF, you should install TeXLive 2012 or later.  To generate EPUB, you should install zip command.
123 | When you want to use MathML, you should install [MathML library](http://www.hinet.mydns.jp/?mathml.rb)
124 | 
125 | Each maker need `config.yml`, configuration YAML files.  `review-init` command generates `config.yml` in default.
126 | 
127 | ```bash
128 | $ review-pdfmaker config.yml     ## generate PDF
129 | $ review-epubmaker config.yml    ## generate EPUB
130 | $ review-textmaker config.yml    ## generate text with decoration
131 | $ review-textmaker -n config.yml ## generate text without decoration
132 | ```
133 | 
134 | You also can generate them with Rake.
135 | 
136 | ```bash
137 | $ rake pdf       ## generate PDF
138 | $ rake epub      ## generate EPUB
139 | $ rake text      ## generate text with decoration
140 | $ rake plaintext ## generate text without decoration
141 | ```
142 | 
143 | There is a sample YAML file [config.yml.sample](https://github.com/kmuto/review/blob/master/doc/config.yml.sample) in the same directory of this document.
144 | 
145 | ### add chapters and modify them
146 | 
147 | `catalog.yml` file is a catalog of Re:VIEW format files.
148 | 
149 | If you create new `*.re` files as new chapters, you should add the name of files into `catalog.yml`.
150 | 
151 | ```bash
152 | $ cat catalog.yml
153 | PREDEF:
154 | 
155 | CHAPS:
156 |   - first-chapter.re
157 |   - second-chapter.re
158 | 
159 | APPENDIX:
160 | 
161 | POSTDEF:
162 | ```
163 | 
164 | The first item in CHAPS is the first chapter, and the second item (if you add) is the second chapter. PREDEF is for front matter, APPENDIX is for appendix, and POSTDEF is for back matter.  You can see in detail with [catalog.md](https://github.com/kmuto/review/blob/master/doc/catalog.ja.md).
165 | 
166 | 
167 | ### more information
168 | 
169 | For more information about Re:VIEW format, see [format.md](https://github.com/kmuto/review/blob/master/doc/format.md).
170 | 
171 | ## convert file by file
172 | 
173 | You can convert a *.re file with `review-compile` command.
174 | 
175 | When you want to convert sample.re, you can do as belows:
176 | 
177 | ```bash
178 | $ review-compile --target text sample.re > sample.txt    ## for text
179 | $ review-compile --target html sample.re > sample.html   ## for HTML
180 | $ review-compile --target latex sample.re > sample.tex   ## for LaTeX
181 | $ review-compile --target idgxml sample.re > sample.xml  ## for XML
182 | $ review-compile --target markdown sample.re > sample.md ## for Markdown
183 | ```
184 | 
185 | `review-compile` and other commands in Re:VIEW has `--help` option to output help.  `review-compile` has many options, so you may see them.
186 | 
187 | ## preprocessor and other commands
188 | 
189 | With Re:VIEW tags such as `#@mapfile`, `#@maprange` and `#@mapoutput`, you can include content of files or result of command execution. To do so, you use `review-preproc` command.
190 | 
191 | ```bash
192 | $ review-preproc hello_orig.re > hello.re   ## redirect stdout into file
193 | 
194 | ## also:
195 | $ review-preproc --replace hello.re   ## update files overwriting
196 | ```
197 | 
198 | You can use `review-vol` command to know the volume of the document.
199 | 
200 | ```bash
201 | $ review-vol
202 | ```
203 | 
204 | You can also use `review-index` command to generate header list.
205 | 
206 | ```bash
207 | $ review-index --level <heading level> -a
208 | ```
209 | 
210 | ## Copyright
211 | 
212 | The original author of Re:VIEW is Minero Aoki. The current maintainer is Kenshi Muto(@kmuto), and committers are Masayoshi Takahashi and Masanori Kado (2016/04).
213 | 
214 | If you want to report bugs and patches, or to get more information, see:
215 | 
216 | * http://reviewml.org/
217 | * https://github.com/kmuto/review/wiki
218 | 


--------------------------------------------------------------------------------
/doc/writing_vertical.ja.md:
--------------------------------------------------------------------------------
 1 | # 縦書きのサポート（実験的）
 2 | 
 3 | Re:VIEW 2.0 より、縦書きの実験的なサポートを含めています。このドキュメントでその利用方法を説明します。
 4 | 
 5 | このドキュメントは、Re:VIEW 2.0 に基づいています。
 6 | 
 7 | ## Re:VIEW フォーマットテキストファイルでの利用
 8 | 縦書きのドキュメントをサポートするため、次のような機能を提供します。
 9 | 
10 | ### 縦中横文字
11 | 縦書き中の1〜2文字を横置きに回転させる目的で、インライン命令 `@<tcy>` を用意しました。
12 | 
13 | ```
14 | @<tcy>{縦中横化する文字}
15 | ```
16 | 
17 | 図表などの大きなブロックを回転させる用途ではありません。2桁の半角アラビア数字などのごく小さな箇所の回転に対応するものです。
18 | 
19 | ### 採番の漢数字や全角対応
20 | locale.yml の番号付けに縦書き向けの以下のカスタムフォーマットを用意しています。
21 | 
22 | * `%pAW` : アルファベット（大文字・いわゆる全角）Ａ, Ｂ, Ｃ, ...
23 | * `%paW` : アルファベット（小文字・いわゆる全角）ａ, ｂ, ｃ, ...
24 | * `%pJ` : 漢数字 一, 二, 三, ...
25 | * `%pdW' : アラビア数字（0〜9まではいわゆる全角、10以降半角）１, ２, ... 10, ...
26 | * `%pDW' : アラビア数字（すべて全角）１, ２, ... １０, ...
27 | 
28 | ## EPUB（review-epubmaker）
29 | HTML のボディ部が縦書きになるよう、CSS ファイル（review-init コマンドで作成した雛型を利用しているのであれば style.css）にスタイルを追加します。
30 | 
31 | ```css
32 | body {
33 |     （…既存の設定…）
34 |     -webkit-writing-mode: vertical-rl;
35 |     -epub-writing-mode:   vertical-rl;
36 |     writing-mode: tb-rl;
37 | }
38 | ```
39 | 
40 | また、縦書きの書籍は通常、「左開き」（右ページから左ページへ進む）となるので、config.yml の direction パラメータを設定します。
41 | 
42 | ```yaml
43 | direction: "rtl"
44 | ```
45 | 
46 | なお、仕様としては正しくても、正しく表示されるかは EPUB リーダーおよび使用フォントに強く依存します（たとえばフォントの選択によっては、句読点が横書き位置のままで崩れた表示になることがあります）。
47 | 
48 | ## TeX PDF（review-pdfmaker）
49 | review-pdfmaker のバックエンドとなっている TeX で縦書きを利用するには、ドキュメントクラスファイルを縦書き対応のものに変更する必要があります。config.yml に次のように追加します（`"oneside"` の箇所は必要に応じて変更してください）。
50 | 
51 | ```yaml
52 | texdocumentclass: ["utbook", "oneside"]
53 | ```
54 | 
55 | utbook クラスは uplatex に合わせた縦書きの紙面デザインを提供します（platex を使用する場合は tbook クラスを使います）。マクロや追加パッケージが縦書きに対応していない場合、エラーあるいは予想外の結果になることがあります。
56 | 


--------------------------------------------------------------------------------
/doc/writing_vertical.md:
--------------------------------------------------------------------------------
1 | # Supporing Vertical Writing (experimental)
2 | 
3 | From Re:VIEW 2.0, Re:VIEW supports vertical writings, especially for Japanese document.
4 | 
5 | If you need any further information, please read [writing_vertical.ja.md](writing_vertical.ja.md) (in Japanese).
6 | 


--------------------------------------------------------------------------------
/file-io.re:
--------------------------------------------------------------------------------
  1 | = ファイルの読み書き
  2 | 
  3 | 
  4 | 永続ストレージ上のデータ操作は、メインメモリ上でのデータ操作とは異なります。
  5 | この章では、典型的な永続データを管理するための方法として、ファイルの読み書きについて説明します。
  6 | ファイルシステムは、ほとんどの OS が用意している永続データ管理の仕組みです。
  7 | もちろん、ブロックデバイスを直接扱ったり、他のデバイス専用インターフェースを利用して
  8 | 永続データを操作することも有り得ますが、それは
  9 | デバイスの性能特性をより生かしたいとか、特殊なインターフェースを使わざるを得ない、など
 10 | 特別な理由があるときに限られます。
 11 | 
 12 | ここでは Linux OS のシステムコールを使って説明しますが、
 13 | 各言語で使えるファイル操作ライブラリなどは全部これらのラッパーと思ってもらって良いです。
 14 | 引数をどのように指定するか、返り値をどう解釈するかなど、具体的なシステムコールの使い方
 15 | については説明していませんので、必要に応じて man を見てください。
 16 | @<tt>{man 2 open} と実行すると、システムコール @<tt>{open()} の manual を読めます。
 17 | 数字の意味は @<tt>{man man} コマンドを参照のこと。
 18 | 
 19 | ファイル操作の方法は主に二種類存在します。
 20 | @<tt>{read/write} を使う方法と @<tt>{mmap} を使う方法です。
 21 | 
 22 | 
 23 | == 基本的なシステムコール
 24 | 
 25 | === 共通: @<tt>{open()}, @<tt>{close()}
 26 | 
 27 | ファイルを Open したり Close したりします。Open してないファイルは読み書きや Mmap できません。
 28 | Open されているファイルはファイルディスクリプタ (通称 @<tt>{fd}) で管理します。
 29 | @<tt>{open()} に渡す @<tt>{flags} に指定できる値は一通り眺めておきましょう。
 30 | @<tt>{O_APPEND}、@<tt>{O_TRUNC}、@<tt>{O_SYNC}、@<tt>{O_DSYNC}、@<tt>{O_DIRECT} あたり。
 31 | 
 32 | 
 33 | 
 34 | === 読み書き: @<tt>{read()}, @<tt>{write()}, @<tt>{lseek()}
 35 | 
 36 | その名の通り、ファイル上でデータを読み書きします。ブロックデバイスとは異なり、
 37 | ファイルシステムがよろしくやってくれますので、Byte 単位で任意の Size のデータを読み書きできます。
 38 | ただし、ファイルシステムの下にブロックデバイスがいる場合は、最終的に
 39 | ブロック単位のアクセスになることはお忘れなく。
 40 | ファイル上の位置を指定するシステムコールが @<tt>{lseek()} として分離されているので注意が必要です。
 41 | @<tt>{lseek()} と @<tt>{read()}/@<tt>{write()} が合体したものと見做せる @<tt>{pread()}/@<tt>{pwrite()} もあります。
 42 | その他、関連するシステムコールとして @<tt>{readv()}, @<tt>{writev()}, @<tt>{preadv()}, @<tt>{pwritev()} などがあります。
 43 | 
 44 | 
 45 | 典型的な使い方では Read/write はファイルシステムが管理する Page cache を通して
 46 | 下位の永続ストレージデバイスにアクセスします。
 47 | Page cache とは、ページ (4KiB) 単位のメインメモリを用いたブロックデバイス
 48 | データのキャッシュ管理機構です。
 49 | ユーザーランドから Page cache の振舞いを細かく制御することは難しいですが、
 50 | カーネルにヒントを与えることはできます。@<tt>{posix_fadvise()} を参照ください。
 51 | DBMS は自分でキャッシュ管理することも多いです。
 52 | Page cache を使いたくない場合は @<tt>{O_DIRECT} で Open して使います。
 53 | その場合、後述する libaio や iouring を使うことも考えられるでしょう。
 54 | 
 55 | 
 56 | 
 57 | === 永続化: @<tt>{fsync()}, @<tt>{fdatasync()}
 58 | 
 59 | データの永続化を行うシステムコールです。
 60 | @<tt>{write()} 等の書き込み処理を終えた後に、@<tt>{fsync()}や @<tt>{fdatasync()}を呼んで、正常終了したことを確認しない限り、書き込んだデータが永続化されている保証はありません。
 61 | 逆に、@<tt>{fsync()}/@<tt>{fdatasync()} を呼ばなくても、永続化されている可能性はもちろんありますので、注意してください。
 62 | @<tt>{write()} を呼んだ時点でいつ永続化されても文句はいえませんということです。
 63 | 
 64 | 
 65 | 
 66 | === mmap
 67 | 
 68 | @<tt>{mmap()} システムコールは、Open されているファイルの一部(または全部)の連続領域を
 69 | プロセスメモリ空間にマップします。@<tt>{munmap()} はマッピングを開放します。
 70 | マッピングされたメモリを読み書きすると、ファイルの読み書きができます。
 71 | 内部的に Page cache をうまく使ってくれますが、ファイルシステムが用意しているキャッシュ管理アルゴリズムに
 72 | 依存するところが多いので、細かい制御は難しいです。
 73 | @<tt>{msync()} システムコールは、変更の永続化を強制します。
 74 | @<tt>{msync()} の完了は永続化済みであることを保証しますが、
 75 | @<tt>{fsync()} のときと同様にマッピングされたメモリに書き込んだ時点でいつそのデータが永続化されても文句は言えません。
 76 | 
 77 | 
 78 | Mmap はファイルのデータ空間をメモリにマップする機能以外に、
 79 | メモリを確保する用途 (@<tt>{malloc()} と同様、ただし、内部的な動作は多少違います) でも使えます。
 80 | 特に Huge page を確保するために使われます。
 81 | 
 82 | 
 83 | ====[column] Huge page
 84 | 
 85 | 随分前から CPU は、プロセス毎にメモリ空間を分ける OS の仕組みを高速化する機能を提供してきました。
 86 | それが、MMU (Memory Management Unit) と TLB (Translate Lookaside Buffer) cache です。
 87 | MMU は OS が用意した Page table を辿って、通常プログラムが使うメモリアドレスである Virtual address から、
 88 | 実際にメモリ上で扱われるアドレスである Physical address への変換を行なうハードウェアです。
 89 | 変換といっても Page table を辿るのは複数回のメモリ参照が必要になるため、
 90 | それを効率化するハードウェアキャッシュが用意されています。それが TLB cache です。
 91 | 最近使った変換結果は TLB cache に格納されていて、
 92 | そこにエントリが存在すれば、アドレス変換が高速に実行できます。
 93 | 
 94 | x86_64 の場合、長らく 4KiB ページが使われてきたのですが、
 95 | 他にも 2MiB や 1GiB 単位の大きなページをサポートしています。これらを Linux では Huge page と呼びます。
 96 | MMU や TLB の処理はページ単位なので、大きなメモリを扱うプログラムやシステムにとっては、
 97 | ページサイズが大きい方が TLB で扱えるメモリが事実上大きくなり、性能が向上します。
 98 | DBMS は恩恵を受ける典型的なソフトウェアであることは言うまでもありません。
 99 | 
100 | ====[/column]
101 | 
102 | 
103 | === Read/write と Mmap どちらをどう使うか
104 | 
105 | 単に新しくファイルを Open して、先頭から順に書いて、Close するのであれば、
106 | Mmap ではなく @<tt>{write()} を使うと良いでしょう。
107 | Read-only (それ以上変更しないことに決めた) ファイル上で検索などの複雑な読み込み操作をするときは、
108 | Mmap 経由でアクセスすればコードが単純になると思います。
109 | それでも参照データをポインタに変換するなどの手間は必要です。
110 | Mmap を使う場合、変更されたデータの永続化を @<tt>{msync()} を呼ぶことで保証することができますが、
111 | 逆に永続化されていないことを保証する仕組みが備わっていないことに注意してください。
112 | データがすぐに永続化されては困る場合は、データを別バッファなどに一時的に記録しておいて、
113 | マッピングされたメモリに書くのを遅らせるなどの工夫が必要になるでしょう。
114 | @<tt>{write()} を使う場合は、バッファの書き換えと @<tt>{write()} の呼び出し操作が分離されていますから、
115 | ファイルへの反映タイミングをある程度制御できます。
116 | 
117 | 
118 | == その他の話題
119 | 
120 | 
121 | === 非同期 IO
122 | 
123 | Linux では aio という非同期 IO が使えます。
124 | 同期 IO は対応する Read/write システムコールが完了したら IO も完了しています
125 | (Write については、必ずしも永続化されているわけではないことに注意)が、
126 | 非同期 IO では IO の Submit と Completion 待ちが別の API として分かれています。
127 | @<tt>{open()} した後、aio 専用のシステムコール(そのラッパー)を呼ぶことに変わりはありませんが、
128 | @<tt>{open()} の @<tt>{flags} 引数に @<tt>{O_DIRECT} をつけること、
129 | 使うバッファが Block size に Alignment されていることなどが要求されます。
130 | 興味がある人は libaio というライブラリをインストールして使ってみてください。
131 | Linux においては posix aio (@<tt>{struct aiocb} を使う) も使えますが、
132 | libaio (@<tt>{io_context_t} を使う) の方が良いです。
133 | 
134 | 最近の Linux kernel (version 5.1) には @<tt>{io_uring} という新しいインターフェースも加わりました。
135 | @<tt>{io_uring} を使うと IO 毎のシステムコールが不要になり、オーバーヘッドが小さくなる利点があります。
136 | DPDK や SPDK (ユーザーランドとデバイス間のやりとりにおいてカーネルを介さない)ほど
137 | 思い切ったアプローチではありませんが、
138 | ユーザーランドとカーネルのやりとりを効率化するという点では近いものを感じます。
139 | いずれ非同期 IO のデファクト・スタンダードは @<tt>{io_uring} になると思われます。
140 | 
141 | 
142 | 非同期 IO を使う際に注意すべき点があります。それは永続化の対象についてです。
143 | Write 相当の IO の永続化を保証するためには、当該 Write IO が「完了」した後に、
144 | 対応する永続化命令 (@<tt>{fsync/fdatasync} もしくはそれらに相当する命令) を「発行」
145 | するという順序を守る必要があります。Write 命令と永続化命令を続けて発行し、
146 | 両方が完了したとしても、当該 Write 命令の内容が永続化されている保証はありません。
147 | これは Linux だけじゃなくて、おそらくブロックストレージに関わる全てに共通する仕様だと思いますので、
148 | 気をつけてください。私は昔この仕様を勘違いしていて酷い目にあったことがあります(実話)。
149 | 
150 | 
151 | 
152 | === Hole
153 | 
154 | Linux ファイルシステムの比較的新しい機能として Hole があります。
155 | ファイルシステムがサポートしている場合は使えます。
156 | 文字通り、ファイルに穴 (Hole) を空けます。
157 | Hole は Zero データが入っているように見えますが、ファイルのデータブロックとしての実体は確保されていません。
158 | Hole には使用領域を節約できる、アクセスを高速化できる、という効果があります。
159 | @<tt>{fallocate()} を使って穴を空けます(Punch hole)。
160 | 最小 Size や Alignment の制約が強いので注意してください。
161 | 必要な場合、@<tt>{lseek()} の @<tt>{whence} 引数に @<tt>{SEEK_DATA} か @<tt>{SEEK_HOLE} を指定して Hole を検知できます。
162 | 
163 | 
164 | === その他 API
165 | 
166 | @<tt>{ftruncate()} は、ファイルサイズを変更します。
167 | @<tt>{flock()} はファイルを排他します。排他用途で使えるものとして
168 | @<tt>{lockf()} や @<tt>{fcntl()} もありますが、出来ることや挙動が微妙に違うので注意しましょう。
169 | 
170 | 
171 | === メタデータ/ディレクトリの操作
172 | 
173 | ファイルのメタデータやディレクトリの操作は、別のシステムコール/関数群
174 | があります。
175 | 
176 |  * @<tt>{fstat()}, @<tt>{stat()}, @<tt>{lstat()}
177 |  * @<tt>{chmod()}, @<tt>{chown()}
178 |  * @<tt>{link()}, @<tt>{symlink()}, @<tt>{unlink()}, @<tt>{rename()}
179 |  * @<tt>{mkdir()}, @<tt>{rmdir()}
180 |  * @<tt>{opendir()}, @<tt>{closedir()}, @<tt>{readdir()}, @<tt>{scandir()} (これらはシステムコールというより glibc 関数)
181 | 
182 | 
183 | === ブロックデバイスについて
184 | 
185 | 多くの OS における多くのファイルシステムは、
186 | Linux ではブロックデバイスと呼ばれる永続ストレージを抽象するデバイスの上で動きます。
187 | 詳しくは@<secref>{memo|sec-block-device}に書きましたので参考にしてください。
188 | 


--------------------------------------------------------------------------------
/images/cover.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/starpos/develop-transaction-system/dac1ddb9e7792ee46bc5c749ad1aaf84076d62f8/images/cover.jpg


--------------------------------------------------------------------------------
/indexes.re:
--------------------------------------------------------------------------------
  1 | = インデクス
  2 | 
  3 | インデクス(Index, 索引)は、ひとことで言うと、
  4 | ある Table において Key を指定して Record を絞り込む操作を高速に実行するための補助的なデータ構造です。
  5 | インデクスがなくても、Table の全 Records をチェックすれば、絞り込み操作は実現できます。
  6 | これを Table の Full scan と呼びます。
  7 | 例えば、1M 個 (M は Million、100万の意味) の Records が存在する Table の中で、たった 1 行を見付け出すために
  8 | 1M 個の Records を全部読んで調べるというのはいかにも効率が悪いですね。
  9 | 
 10 | 典型的なインデクスは Tree map または Hash table を使って構成されています。
 11 | これらは N 個の Records から成る Table を検索するために必要なデータアクセスが、
 12 | log N 回程度で済んだり、定数回程度で済んだりするようなデータ構造です。
 13 | しっかりと考える場合は最悪のケースも検討しなければなりませんが、
 14 | 今はそれをあまり考えずに、これらのアクセス回数の目安を O(log N)、O(1) と書いて表現します。
 15 | 詳しく知りたい人は、「計算量」や「O記法」などのキーワードで調べてみてください。
 16 | アルゴリズムとデータ構造の教科書には必ず載っているはずです。
 17 | 
 18 | 
 19 | == Tree map を用いたインデクス
 20 | 
 21 | Tree map を実現するには Directed rooted tree (根付き有向木) 構造を使います。
 22 | Directed rooted tree は Directed graph (有向グラフ) に制約を加えたものです。
 23 | Directed graph を表現するためには Vertex (頂点) の集合 @<m>{V} と Edge (辺) の集合 @<m>{E \subset V \times V} を用います。
 24 | @<m>{e=(v_1, v_2) \in E} について、
 25 | @<m>{v_1}から見て@<m>{e}を Outcoming edge、
 26 | @<m>{v_2}から見て@<m>{e}を Incoming edge と呼びます。
 27 | また、@<m>{e} から見て @<m>{v_1} を Source、@<m>{v_2} を Destination と呼びます。
 28 | Directed rooted tree とは、
 29 | (1) 連結 (Connected) しており、
 30 | (2) Incoming edge が存在しない Root (根) と呼ばれる Vertex がひとつだけ存在し、
 31 | (3) Root 以外の Vertex は全て Incoming edge が唯ひとつのみ存在する、
 32 | これらの条件を全て満たす Directed graph です。
 33 | Outcoming edge の存在しない Vertex を Leaves (葉) と呼びます。
 34 | 各 Vertex にとって、自身の Outcoming edge で直接繋がっている Vertex を Children(子) と呼び、
 35 | Incoming edge で直接繋がっている Vertex を Parent(親) と呼びます。
 36 | Directed rooted tree を考えるときは Vertex のことを Node と呼ぶことが多いので
 37 | ここでもそれに倣います。
 38 | 
 39 | 実際にメモリ上で Tree map を作るとき、典型的には Node を構造体として作ります。
 40 | Children や Parent を参照するのにはポインタを使います。
 41 | (Parent へのポインタはなくても良いですが、効率的なアクセスのため用意することが多いです。
 42 | その代わり、冗長な情報を持つことになるので操作時に気を使う必要が出ます。)
 43 | 
 44 | Tree map は Key を表す型が全順序を持つことを要求します。
 45 | Tree map を Directed rooted tree で実現するとき、
 46 | 各 Node は自分の担当する Key の連続部分空間を Children の数だけ連続部分空間に分割して保持します。
 47 | ここでの連続部分空間とは、ひとつの範囲で表現できる部分空間、という意味で使っています。
 48 | つまり、ある Key 値を持つ Record が存在するならば、Root node から
 49 | Key 値が含まれる連続部分空間を持つ Child を選ぶという操作を繰り返すことで
 50 | 到達した Leaf node が保持していることが保証されます。
 51 | つまり、木の深さ分だけ Child を辿れば良いわけです。
 52 | 木の深さは木がバランスしている(一番深い Leaf node と浅い Leaf node の深さの差が高々定数倍と見做せる)とき、
 53 | Node 数 N に対して深さが O(log N) と見做せ、
 54 | 平均的には O(log N) のステップ数で Record に辿りつけます。
 55 | 
 56 | 
 57 | 二分木(Fanout すなわち Children の数が高々 2 の木構造)による
 58 | Key の型が整数である Tree map の例を示します:
 59 | 
 60 | 
 61 | //list[tree_map_example][]{
 62 | Root:
 63 |   border_key: 5
 64 |   children: N11, N12
 65 | 
 66 | N11:
 67 |   border_key: 3
 68 |   children: N21, N22
 69 | 
 70 | N12:
 71 |   border_key: 8
 72 |   children: N23, N24
 73 | 
 74 | N21:
 75 |   border_key: 1
 76 |   records: (1, 'aaa')
 77 | 
 78 | N22:
 79 |   records: (3, 'ccc'), (4, 'ddd')
 80 | 
 81 | N23:
 82 |   records: (6, 'fff')
 83 | 
 84 | N24:
 85 |   records: (8, 'hhh'), (10, 'jjj')
 86 | //}
 87 | 
 88 | 
 89 | Root node には @<tt>{border_key} として 5 が格納されています。これは、Left child を辿っていった先には
 90 | @<tt>{key} @<m>{<} 5 の record しか存在しないことを意味します。
 91 | 同様に、Right child を辿っていった先は 5 @<m>{\le} @<tt>{key} の Record しか存在しないことを意味します。
 92 | N12 は 5 @<m>{\le} @<tt>{key} の連続領域を担当しています。
 93 | そして、担当領域をさらに 5 @<m>{\le} @<tt>{key} @<m>{<} 8 と 8 @<m>{\le} @<tt>{key} の 2 つの領域に分割し、
 94 | それぞれ Children である @<tt>{N23, N24} に割り当てます。
 95 | @<tt>{N21, N22, N23, N24} は Leaf node なので、その中に Children へのポインタではなく、
 96 | 対応する Key 値を持つ Record (もしくは Record へのポインタ等)が格納されています。
 97 | この例では @<m>{N = 7}、@<m>{\log_{2\} N \approx 2.8} で、深さは 3 となります。
 98 | 
 99 | Tree map が有効に機能するためには木がバランスしていることが必要となります。
100 | これを実現する操作方法を持つ木構造をバランス木と呼びます。
101 | 二分木だと、赤黒木(Red-black tree) や AVL-tree が例として挙げられます。
102 | また、大前提として Fanout は 2 以上であることが必要となります。
103 | Fanout が 1 だと、Root を先頭とする連結リスト構造を意味しますので、我々が欲しい性質を持たないからです。
104 | 
105 | 扱うデータの量が使えるメインメモリよりも大きいことが想定される DBMS は、
106 | メインメモリとディスク@<fn>{footnote_disk}上の細かいデータのやりとりを頻繁に行う必要があるため、
107 | ページと呼ばれる(4KiB や 16KiB などの)固定サイズ連続領域を Node として扱う
108 | B+tree もしくはその亜種が良く使われています。
109 | 一般に、Non-leaf node は Fanout - 1 個の Key を格納する必要があるので、
110 | B+tree の Fanout は Key のサイズに依存します。
111 | 
112 | //footnote[footnote_disk][HDD や SSD などの不揮発性を持つ二次記憶装置のことを総称してディスクと呼んでしまったりします。Hard Disk Drive の Disk です。一方で、不揮発メモリ(NVRAM) をディスクと呼ぶことに私は抵抗があります。たぶん、ブロックデバイスとして扱うか、バイト単位(実際はキャッシュライン単位)で扱うかで大きな隔りがあるのでしょう。]
113 | 
114 | 昨今研究開発が盛んなインメモリデータベースは、データが全てメインメモリに納まる前提を置きますが、
115 | 必ずしもディスク上の構造とメモリ上の構造が一致する必要はないため、
116 | メモリ上の Tree map の表現は、必ずしもページではなく、
117 | ポインタなどの間接参照データが使われていても問題ありません。
118 | 
119 | C++ を使っていてとりあえず Tree map が欲しいときは、
120 | @<tt>{std::map<Key, Value>} 型のオブジェクトを作ればそれでおしまいです。
121 | もちろん Thread-safe ではないことには注意が必要です。
122 | Rust だと標準で @<tt>{std::collections::BTreeMap} なるものが使えるらしいです。
123 | しかし、内部の Node に直接アクセスできるわけではないので、
124 | 使い勝手は C++ の @<tt>{std::map} とあまり変わらないかも知れません。
125 | 
126 | 
127 | == Hash table を用いたインデクス
128 | 
129 | 
130 | @<m>{N} を自然数とし、Key 空間から @<m>{\\{0, 1, ..., N-1\\\}} への写像 @<m>{h} を考えます。
131 | 例えば、Key 値を入力として適当な非負整数を出力する副作用のない関数を用意し、
132 | 出力された非負整数を @<m>{N} で割って余りをとれば @<m>{h} は実現できます。
133 | 
134 | また、予め @<m>{N} 個のバケットと呼ばれる要素からなる配列を用意しておき、
135 | Key 値から @<m>{h} で得た値を配列のインデクスとしてひとつのバケットにアクセスします。
136 | バケットには、複数の Record が格納できるようになっており、
137 | バケット内の Key が一致する Record を探すことで絞り込みます。
138 | 一例としてバケット内の Records は連結リストを用いて管理します。
139 | 同一の Key 値を持つ Record は他のバケットには存在しないことが保証されており、
140 | このバケット内を探すだけで済みます。
141 | 
142 | 以上が素朴な Hash table の設計です。たくさんの亜種があります。
143 | 写像 @<m>{h} は Hash 関数と呼ばれており、
144 | このデータ構造が Hash table と呼ばれている理由となっていると思います。
145 | Hash 関数は入力サイズに依存する計算量を必要とするものを使いますが、
146 | Key サイズは Record 数を @<m>{M} としたとき、@<m>{M} に対して定数と見做せることがほとんどです。
147 | つまり Key 値からバケットを特定する計算量は @<m>{O(1)} となります。
148 | 
149 | 
150 | Hash table が有効に機能するためには、
151 | 各バケットに格納されている Record 数が高々定数と見做せることが求められます。
152 | このとき、Key 値から Record に到達するための計算量が @<m>{O(1)} と見做せるからです。
153 | そのため、@<m>{h} は典型的に使われる Key 空間の部分集合に対して一部のバケットに偏らないような
154 | 値を出力することが求められます。
155 | また、ここで説明した Hash table はバケット数 @<m>{N} が固定であるため、
156 | @<m>{N} に対して Record 数 @<m>{M} が小さすぎれば空のバケットが多くなって空間が無駄になるし、
157 | 逆に大きすぎれば、バケット内の Record 数が増えすぎて定数と見做せなくなってしまいます。
158 | このような状況に対応するため、@<m>{N} 個の要素を持つ配列から
159 | (通常は @<m>{N < N'} であるような) @<m>{N'} 個の要素を持つバケット配列にデータを移動することを Rehash と呼びます。
160 | このとき、値域が異なるので、当然 Hash 関数も異なります。@<m>{N} で割る代わりに @<m>{N'} で割るなどする必要があるからです。
161 | Rehashは 一般に @<m>{O(M)} かかりますので、
162 | Rehash が頻繁に発生する状況は Hash table が有効に機能しているとは言い難いです。
163 | 
164 | 
165 | 如何にごく単純な Hash table の例を示します。Key 型は @<tt>{uint}とし、@<m>{h} は簡単のためただの剰余としました:
166 | 
167 | //list[hash_table_example][]{
168 | h(key: uint) -> {0,1,2,3,4}:
169 |   return key % 5
170 | 
171 | Array as a hash table with size 5:
172 |   [B0,B1,B2,B3,B4]
173 | 
174 | 
175 | B0: (10, 'jjj')
176 | B1: (1, 'aaa'), (6, 'fff')
177 | B2: (7, 'ggg'), (12, 'lll')
178 | B3:
179 | B4: (9, 'iii')
180 | //}
181 | 
182 | @<m>{N = 5} の Hash table です。@<m>{h} はただの剰余なので、
183 | 5 で割った余りがそのままバケットインデクスを示しています。
184 | 
185 | 
186 | C++ を使っていてとりあえず Hash table が欲しいときは、
187 | @<tt>{std::unordered_map<Key, Value>} 型のオブジェクトを作ればそれでおしまいです。
188 | Rust だと @<tt>{std::collections::HashMap} が対応します。
189 | これらについても Thread-safe ではありません。
190 | 少し探せば、Thread-safe な Concurrent hash map の実装はいくつかあるようです。
191 | 
192 | 
193 | 
194 | == インデクスのトレードオフ
195 | 
196 | ひとつの Table について、一般に Key (型)は複数存在します。
197 | 典型的にはひとつの Key についてインデクスを高々ひとつ作って使います。
198 | 性質の異なるインデクスを同じ Key に対して作ることは考えられなくはないですが、
199 | それはかなり特殊な状況だと思います。
200 | 
201 | インデクスはその Key を用いた絞り込み操作を高速化しますが、その代償として、
202 | Record をひとつ Write する度に、変更に関係するインデクスを全て更新する必要が生まれ、
203 | Record の Write コストが増えるというデメリットが発生します。
204 | どの Key についてのどのようなデータ構造を用いたインデクスが必要か、
205 | または不要かについての判断は、データベースの Key 分布と
206 | ワークロード(どのようなアクセスがどの程度発生するか)に依存します。
207 | つまり、最適なインデクス構成を決めるのは簡単ではないということです。
208 | 
209 | また、インデクスの使用についても難しい問題があります。
210 | 複数の条件で Record を絞り込む場合、必ずしも全ての条件に一致するインデクスが必要というわけではありません。
211 | 例えば、@<tt>{age = 30 and weight = 60} という条件であれば、
212 | @<tt>{(age, weight)} という Key に対応するインデクスを使う方法もありますが、
213 | @<tt>{(age)} という Key に対応するインデクスで絞り込んだ Records を
214 | さらに @<tt>{(weight)} という Key に対応するインデクスで絞り込む方法もありますし、
215 | @<tt>{(age)} のインデクスで絞り込んだ Records を全部チェックするという方法もあります。
216 | 性能の指標として重要なのは、最初もしくは最初の方でどれだけ絞り込めるかという点です。
217 | そもそも Table に格納されている Records 数が少ない場合は Table full scan の方が高速なこともあります。
218 | 
219 | SQL をサポートする DBMS にはクエリ最適化(Query optimization)、もしくは
220 | 実行計画(Execution plan)作成と呼ぶ処理を行う機能があります。
221 | その処理の中で最も重要な仕事が最適な絞り込み方法を推定することです。
222 | Query optimization は SQL のような宣言的言語で書かれた命令を実行するときに必要になりますが、
223 | 組み込み DBMS では Execution plan を直接的にアプリケーションコードが書き下すことが多いです。
224 | つまり、そのような DBMS ではどのインデクスをどの順番で使って Records を絞り込むかについても明示的に指定します。
225 | 
226 | どのインデクスを作るかについての判断は、どのインデクスをどの順番で使うかの判断よりも頻度が低いです。
227 | 前者はデータベース物理設計、後者はクエリ最適化における判断なので。
228 | 最近の商用プロダクトの一部では、
229 | ワークロードを監視して自動的にインデクスを作成したり削除したりする機構も
230 | 実用化されているようなので、インデクス構成についての判断の頻度は上がっていると言えるでしょう。
231 | また、特定の Key 範囲のみインデクスを作成することも有り得ます。
232 | これらの判断はすべてインデクス作成と使用のトレードオフがあるから必要となるのです。
233 | 
234 | 
235 | 
236 | == インデクス構造のアクセス排他
237 | 
238 | シングルスレッドのプログラムであれば、インデクス構造を触っているのは自分ひとりなので、
239 | アクセス排他について何も考える必要がありません。
240 | もし、マルチスレッド/マルチプロセスのプログラムで、複数の Worker が同一のインデクス構造を触るときは、
241 | アクセス排他の仕組みが必要となります。
242 | これらのデータ構造は Concurrent tree とか Concurrent hash map などと呼ばれます。
243 | 総称して Concurrent index と呼ぶようです。
244 | これらを自作する場合、どの部分をどう排他すべきかについて考える必要が生じますが、
245 | これはこれで深淵な世界であり、一筋縄ではいきません。本書ではこれ以上踏み込みません。
246 | 
247 | 
248 | == Table 本体の構造について
249 | 
250 | 
251 | 
252 | Table そのものはどのような構造をしているのかについて、2 パターン考えられます。
253 | 1 つ目は、Table 本体もインデクスとして実装する場合です。
254 | この場合は Primary key もしくは代理 Key が定義されていて、それを使って
255 | Record 本体の格納場所まで効率的に辿りつけるようになっています。
256 | この場合、Table full scan はこのインデクスを強制的に使うことになりますし、
257 | その他のインデクスにおける Value は Primary key を保持することもあります。
258 | 
259 | 2 つ目は、Table 本体は独立したデータ構造として実装する場合です。
260 | この場合、メモリ上、ディスク上のレイアウトには自由度があります。
261 | Table full scan のみ実行できれば良いからです。
262 | 各 Record の位置は、なんらかのアドレスもしくはその組み合わせで表現することが多いと思います。
263 | 


--------------------------------------------------------------------------------
/lib/tasks/review.rake:
--------------------------------------------------------------------------------
  1 | # Copyright (c) 2006-2021 Minero Aoki, Kenshi Muto, Masayoshi Takahashi, Masanori Kado.
  2 | #
  3 | # Permission is hereby granted, free of charge, to any person obtaining a copy
  4 | # of this software and associated documentation files (the "Software"), to deal
  5 | # in the Software without restriction, including without limitation the rights
  6 | # to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
  7 | # copies of the Software, and to permit persons to whom the Software is
  8 | # furnished to do so, subject to the following conditions:
  9 | #
 10 | # The above copyright notice and this permission notice shall be included in
 11 | # all copies or substantial portions of the Software.
 12 | #
 13 | # THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 14 | # IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 15 | # FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
 16 | # AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 17 | # LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 18 | # OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 19 | # THE SOFTWARE.
 20 | 
 21 | require 'fileutils'
 22 | require 'rake/clean'
 23 | 
 24 | BOOK = ENV['REVIEW_BOOK'] || 'book'
 25 | BOOK_PDF = BOOK + '.pdf'
 26 | BOOK_EPUB = BOOK + '.epub'
 27 | CONFIG_FILE = ENV['REVIEW_CONFIG_FILE'] || 'config.yml'
 28 | CATALOG_FILE = ENV['REVIEW_CATALOG_FILE'] || 'catalog.yml'
 29 | WEBROOT = ENV['REVIEW_WEBROOT'] || 'webroot'
 30 | TEXTROOT = BOOK + '-text'
 31 | TOPROOT = BOOK + '-text'
 32 | IDGXMLROOT = BOOK + '-idgxml'
 33 | PDF_OPTIONS = ENV['REVIEW_PDF_OPTIONS'] || ''
 34 | EPUB_OPTIONS = ENV['REVIEW_EPUB_OPTIONS'] || ''
 35 | WEB_OPTIONS = ENV['REVIEW_WEB_OPTIONS'] || ''
 36 | IDGXML_OPTIONS = ENV['REVIEW_IDGXML_OPTIONS'] || ''
 37 | TEXT_OPTIONS = ENV['REVIEW_TEXT_OPTIONS'] || ''
 38 | 
 39 | REVIEW_VSCLI = ENV['REVIEW_VSCLI'] || 'vivliostyle'
 40 | REVIEW_VSCLI_USESANDBOX = ENV['REVIEW_VSCLI_USESANDBOX'] ? '' : '--no-sandbox'
 41 | REVIEW_VSCLI_PDF = ENV['REVIEW_VSCLI_PDF'] || BOOK_PDF
 42 | REVIEW_VSCLI_OPTIONS = ENV['REVIEW_VSCLI_OPTIONS'] || ''
 43 | 
 44 | def build(mode, chapter)
 45 |   sh("review-compile --target=#{mode} --footnotetext --stylesheet=style.css #{chapter} > tmp")
 46 |   mode_ext = { 'html' => 'html', 'latex' => 'tex', 'idgxml' => 'xml', 'top' => 'txt', 'plaintext' => 'txt' }
 47 |   FileUtils.mv('tmp', chapter.gsub(/re\z/, mode_ext[mode]))
 48 | end
 49 | 
 50 | def build_all(mode)
 51 |   sh("review-compile --target=#{mode} --footnotetext --stylesheet=style.css")
 52 | end
 53 | 
 54 | task default: :html_all
 55 | 
 56 | desc 'build html (Usage: rake build re=target.re)'
 57 | task :html do
 58 |   if ENV['re'].nil?
 59 |     puts 'Usage: rake build re=target.re'
 60 |     exit
 61 |   end
 62 |   build('html', ENV['re'])
 63 | end
 64 | 
 65 | desc 'build all html'
 66 | task :html_all do
 67 |   build_all('html')
 68 | end
 69 | 
 70 | desc 'preproc all'
 71 | task :preproc do
 72 |   Dir.glob('*.re').each do |file|
 73 |     sh "review-preproc --replace #{file}"
 74 |   end
 75 | end
 76 | 
 77 | desc 'generate PDF and EPUB file'
 78 | task all: %i[pdf epub]
 79 | 
 80 | desc 'generate PDF file'
 81 | task pdf: BOOK_PDF
 82 | 
 83 | desc 'generate static HTML file for web'
 84 | task web: WEBROOT
 85 | 
 86 | desc 'generate text file (without decoration)'
 87 | task plaintext: TEXTROOT do
 88 |   sh "review-textmaker #{TEXT_OPTIONS} -n #{CONFIG_FILE}"
 89 | end
 90 | 
 91 | desc 'generate (decorated) text file'
 92 | task text: TOPROOT do
 93 |   sh "review-textmaker #{TEXT_OPTIONS} #{CONFIG_FILE}"
 94 | end
 95 | 
 96 | desc 'generate IDGXML file'
 97 | task idgxml: IDGXMLROOT do
 98 |   sh "review-idgxmlmaker #{IDGXML_OPTIONS} #{CONFIG_FILE}"
 99 | end
100 | 
101 | desc 'generate EPUB file'
102 | task epub: BOOK_EPUB
103 | 
104 | IMAGES = FileList['images/**/*']
105 | OTHERS = ENV['REVIEW_DEPS'] || []
106 | SRC = FileList['./**/*.re', '*.rb'] + [CONFIG_FILE, CATALOG_FILE] + IMAGES + FileList[OTHERS]
107 | SRC_EPUB = FileList['*.css']
108 | SRC_PDF = FileList['layouts/*.erb', 'sty/**/*.sty']
109 | 
110 | file BOOK_PDF => SRC + SRC_PDF do
111 |   FileUtils.rm_rf([BOOK_PDF, BOOK, BOOK + '-pdf'])
112 |   sh "review-pdfmaker #{PDF_OPTIONS} #{CONFIG_FILE}"
113 | end
114 | 
115 | file BOOK_EPUB => SRC + SRC_EPUB do
116 |   FileUtils.rm_rf([BOOK_EPUB, BOOK, BOOK + '-epub'])
117 |   sh "review-epubmaker #{EPUB_OPTIONS} #{CONFIG_FILE}"
118 | end
119 | 
120 | file WEBROOT => SRC do
121 |   FileUtils.rm_rf([WEBROOT])
122 |   sh "review-webmaker #{WEB_OPTIONS} #{CONFIG_FILE}"
123 | end
124 | 
125 | file TEXTROOT => SRC do
126 |   FileUtils.rm_rf([TEXTROOT])
127 | end
128 | 
129 | file IDGXMLROOT => SRC do
130 |   FileUtils.rm_rf([IDGXMLROOT])
131 | end
132 | 
133 | desc 'preview with vivliostyle'
134 | task 'vivliostyle:preview': BOOK_EPUB do
135 |   sh "#{REVIEW_VSCLI} preview #{REVIEW_VSCLI_USESANDBOX} #{REVIEW_VSCLI_OPTIONS} #{BOOK_EPUB}"
136 | end
137 | 
138 | desc 'build with vivliostyle'
139 | task 'vivliostyle:build': BOOK_EPUB do
140 |   sh "#{REVIEW_VSCLI} build #{REVIEW_VSCLI_USESANDBOX} #{REVIEW_VSCLI_OPTIONS} -o #{REVIEW_VSCLI_PDF} #{BOOK_EPUB}"
141 | end
142 | 
143 | desc 'build with vivliostyle'
144 | task vivliostyle: 'vivliostyle:build'
145 | 
146 | CLEAN.include([BOOK, BOOK_PDF, BOOK_EPUB, BOOK + '-pdf', BOOK + '-epub', WEBROOT, 'images/_review_math', 'images/_review_math_text', TEXTROOT, IDGXMLROOT])
147 | 


--------------------------------------------------------------------------------
/locale.yml:
--------------------------------------------------------------------------------
1 | locale: ja
2 | 


--------------------------------------------------------------------------------
/memo.re:
--------------------------------------------------------------------------------
  1 | = 雑多なメモ
  2 | 
  3 | 
  4 | 本章は、本文に書くにはちょっとな、という雑多な記事が押し込まれており、
  5 | その多くは他の章から参照されています。順番は特に重要ではありません。
  6 | 
  7 | 
  8 | =={sec-block-device} ブロックデバイスとしての永続ストレージ
  9 | 
 10 | ブロックデバイスは固定サイズのデータであるブロックを要素とする巨大な配列として抽象化されたデータ保持のためのデバイスです。
 11 | 配列のインデクスをブロックアドレスといい、アクセスする先頭ブロックのアドレスとブロック単位のサイズ、
 12 | すなわち、ひとつのアドレス範囲を指定することで読み書きします。
 13 | 
 14 | ブロックデバイスという抽象が必要になったのは HDD の性能特性によるところが大きいと思います。
 15 | 昔の HDD はブロックサイズが 512bytes でしたが、今の多くの HDD は 4KiB です。
 16 | HDD の中にはプラッタと呼ばれる磁性体が塗られた円盤が複数枚入っていて、プラッタの上を滑るように
 17 | 動くヘッドと呼ばれる細長い三角形の形をした部品が入っています。
 18 | ヘッドの先がプラッタ上の任意の位置に移動して磁力の向きを検出したり変更したりできるようになっています。
 19 | 実際には、ヘッドはプラッタの中心から外周に向かう線上をステップモータの力で移動できるようになっていて、
 20 | それに加えてプラッタが回転することによってプラッタ上の任意の極小領域にヘッドを位置合わせして
 21 | その位置に記録されているデータを読み書きすることができます。
 22 | 様々な技術によって微細化の努力は今でも続けられていますが、ヘッドの位置合わせ操作の高速化は
 23 | とっくの昔に限界を迎えています。
 24 | 
 25 | プラッタもヘッダも物理的に動いて位置合わせするので、特定のブロックアドレスにアクセスするためには
 26 | ミリ秒単位の時間がかかります。市販されている 3.5inch の HDD で高々 10ms 程度です。
 27 | 一度位置を合わせてしまえば、プラッタの回転に合わせてアクセスできるデータが変化するので、
 28 | 連続領域の読み書き、すなわちシーケンシャルアクセスは比較的高速です。
 29 | 最近の市販されている 3.5inch HDD だと 200MB/s 程度です。
 30 | この連続領域をブロックの配列として捉えることで、アドレスが連続するブロックの読み書きは
 31 | 高々 1 回の位置合わせで実現できるように作られています。
 32 | 
 33 | もし HDD をバイト単位でアクセスできるようにしてしまうと、
 34 | 1byte アクセスする度に位置合わせが必要となってしまう状況が想定され、
 35 | あまりにひどい性能となってしまうので、
 36 | ソフトウェア側にブロック単位でのアクセスを強要することによって、性能が下がりすぎるのを防いでいるというわけです。
 37 | 
 38 | B+tree は、固定サイズの連続メモリ領域を Node として扱い、
 39 | Node をブロックとしてそのままメモリとディスク間でやりとりするときに変換をほとんど必要としないので、
 40 | ブロックデバイス上で管理するインデクス構造として広く使われています。
 41 | Ext4 や xfs などのファイルシステムの多くは、ブロックデバイス上で
 42 | より柔軟なバイト単位のファイルアクセスやファイルおよびディレクトリの管理を行うためのソフトウェアです。
 43 | ディレクトリツリーがツリーと呼ばれるように、ファイルシステムは木構造をブロックデバイス上で
 44 | 管理するという点で B+tree と共通点があります。
 45 | 現代ではファイル抽象を大前提とするソフトウェアがほとんどであるため、OS にファイルシステムは内蔵されています。
 46 | ファイル管理のためのメタデータもやはりブロック単位で管理されます。
 47 | DBMS はストレージデバイスをファイルシステムを介さずに使うことのある数少ないソフトウェアのひとつです。
 48 | 
 49 | Flash メモリ (NAND 型)は、HDD とは別の物質、仕組みを利用した不揮発性ストレージです。
 50 | 具体的にはメモリセルと呼ばれる極小領域に必要な量の電子を閉じ込めることで値を書き、
 51 | その電子の量を間接的に測定することによって値を読みます。
 52 | 半導体なので HDD と異なり機械的な位置合わせは不要なのですが、
 53 | 素子の寿命管理の制約などから、ブロックデバイスとして抽象化するのが典型的な使い方です。
 54 | また、複数の単位を並べて並列にアクセスするストライピングによって
 55 | シーケンシャルアクセスが相対的に高速となる傾向があります。
 56 | 
 57 | バイト単位でアクセスできる不揮発性メモリ(NVRAM)は一部の領域で昔から使われていましたが、
 58 | コスト、容量、性能の面から、
 59 | SRAM、DRAM、Flash メモリ、HDD、(光学メディア、テープ) で構成される
 60 | 典型的なコンピュータストレージ階層で採用されることはこれまでありませんでした。
 61 | (実際は DRAM ですら 32bytes や 64bytes などの Cache line 単位でアクセスされるのですが、
 62 | 512bytes や 4KiB に比べれば十分小さい単位といえるでしょう……)
 63 | 2018 年に 3D Xpoint メモリを使った SSD 製品が、2019 年に NVDIMM として Optane DC Persistent Memory が投入され、
 64 | ストレージ階層に食い込もうとチャレンジしています。
 65 | (なんということでしょう、2022 年現在、Optane memory のビジネスが終わってしまうことが確実なようです……)
 66 | 低コスト、大容量、Flash メモリよりも高性能であるようなバイト単位のアクセスが可能な NVRAM が台頭すれば、
 67 | ブロックデバイスに最適化されたソフトウェアは淘汰される運命ですので、ハードウェアの研究開発には
 68 | DBMS 屋さんとしては目を光らせておく必要が常にあります。
 69 | 
 70 | 
 71 | 
 72 | =={sec-hardware-evolution} ハードウェアの進化とそれに追随するソフトウェア
 73 | 
 74 | 
 75 | ハードウェアの進化によって、効率の良いソフトウェアのアーキテクチャはときどきガラリと変わります。
 76 | 昨今だと、以下の点が大きな変革だと思います:
 77 | 
 78 |  * @<b>{CPU の メニーコア化。} とにかく並列に動かさないと性能が出ない時代が到来しています。
 79 |  * @<b>{メインメモリサイズの増大。} データベースがすっぽり収められる場合もあるくらいメインメモリが増えてきました。
 80 |    In-memory DBMS が真面目に探求されるようになったのがそれを表しています。
 81 |  * @<b>{HDD から Flash memory へ。} シーケンシャルアクセスとランダムアクセスの性能差が縮まり、明示的な永続化命令が必要ないケースも出てきました。
 82 |  * @<b>{高速ネットワークの低価格化。} Ethernet 10G、どんどん安くなっています。
 83 |  * @<b>{GPGPU や FPGA の進化。} トランザクション処理にとっては今のところ影響は少ないと思いますが、分析系の処理には大きな影響があります。Deep Learning の発展と共に、機械学習を用いた最適化も多く模索されるようになりました。
 84 |  * @<b>{NVRAM。} 2019 年現在、3D Xpoint が発売にこぎつけましたが、それがメモリ階層の中で不可欠な役割を担うようになるかまだ五分五分と私は見ています。2021 年現在、雲行きが怪しいです。。2022 年現在、Optane のビジネスが終わることがほぼ確実となりました。
 85 |  * @<b>{CXL (Compute Express Link)。} キャッシュコヒーレンシを保ったメモリアクセスのエコシステム化の時代が来そうです。
 86 |    2022 年現在、まだプロトタイプの評価くらいしか目にしないのですが、
 87 |    メモリデバイスを PCI-express スロットにポン付けしてメインメモリを増やせたり、
 88 |    様々なアクセラレータが登場しそうな未来を感じています。
 89 | 
 90 | 
 91 | トランザクション処理という視点で見ると、今の DBMS 研究の世界で見えているものと、
 92 | 現実の DBMS 実装には大きな乖離があります。
 93 | 今の主流の実装は、1990年代のハードウェアにおいて最適なソフトウェアから継ぎ足し継ぎ足しで進化してきているものが多いと思います。
 94 | 商用の SQL をサポートするようなコードベースが大きい DBMS (Oracle とか MS SQL とか IBM DB2 とか) は、この変化についていくのが大変です。
 95 | それまで儲けたお金で莫大な投資をしなければ、ついていけません。
 96 | MySQL、PostgreSQL などは、どこまで付いていけるか、見物ですね。
 97 | 現代のハードウェアに最適な構成を伴って新たに出てくる OSS や商用の DBMS に取って代わられる可能性も十分あります。
 98 | 最近ですと、NewSQL と呼ばれるバックエンドが分散ストレージになっているプロダクト群、具体的には TiDB や CochroachDB などの勢いが凄そうです(2021 年、個人の感想です)。
 99 | それでも、DBMS はユーザから最も「枯れている」ことを要求されるソフトウェアのひとつなので、
100 | 一旦市民権を確立した DBMS 実装の寿命は相対的に長いと思います。今後の展開が楽しみですね。
101 | 
102 | 
103 | =={sec-readable-code} 読みやすいコードを書きましょう
104 | 
105 | プログラムコードは、機械が解釈し実行する側面(機械解釈)の他に、
106 | 他人もしくは明日の自分が読んで内容を理解したり修正する側面(人間解釈)があります。
107 | だから、機械にとって明快(典型的にはコンパイル可能で、Undefined behavior がない)である
108 | ことだけでなく、人間であるプログラマにとっても読みやすい必要があります。
109 | 趣味で書く使い捨てのコードなら可読性は必要ありません。
110 | しかし、多くのコードは人間に読まれ、長く使うコードはメンテナンスが必須であることから、
111 | 可読性は生産性に直結する重要な要素です。アドホックに生成される例外的なものを除いて、
112 | レビューなしで本番運用されるコードはまずありませんから、
113 | 仕事で書くコードは当然可読性に配慮する必要があります。
114 | 
115 | コーディングするときに可読性に配慮するとして、何に気をつけるべきでしょうか。
116 | それは、文章執筆において読んでもらうための配慮と同じで、
117 | 対象読者が誤解するリスクを減らすことです。
118 | まずは目的です。設計意図と言っても良いです。
119 | 自然言語による文章は構造を持ち、幹と枝葉の他に根という概念があります。
120 | 根は書いた人がそれを書いた目的です。
121 | 文章であれば根も自然言語で書いてしまえばよいのですが、コードではどうでしょうか。
122 | 少なくとも現代の常識では機械に目的や意図を共有する必要はないので、
123 | 根の部分はコードとして表現されていません。
124 | コメントで目的を書きましょうとの教えは、これに対応するものです。
125 | 目的が伝われば、やっていることについて誤解されるリスクが減ります。
126 | 
127 | 変数や関数、構造体などの名前は重要だと説かれます。
128 | これも機械解釈には関係なく、コードを読んだ人間が、
129 | コードが扱っているデータやその操作についてのモデル(抽象的な構造と操作)を理解しやすくするための工夫です。
130 | 名前の情報を使って読者の脳内で再現されるモデルがより正確であれば、
131 | やっていることについて誤解されるリスクが減ります。
132 | 
133 | 誤解されるリスクを減らすという原則を知っていれば、
134 | 文章執筆と同様コーディングにおいても、可読性について正解はないが気をつけるべき点があることが納得できるでしょう。
135 | 個々のテクニックについて説明されている有名な本として「リーダブルコード」(オライリー・ジャパン)があります。
136 | 私も持っていますし、オススメもしています。
137 | 機械に誤解なく解釈してもらうことがコーディングの第一義であるのはいうまでもありませんが、
138 | 人間にも誤解なく解釈してもらうための可読性の重要性についても分かってもらえたら幸いです。
139 | 文章と同じで、他人に読んでもらいフィードバックを受けること、
140 | 自分もまた他人のコードを読みフィードバックすること、
141 | これらの実践の他に、本などで知識を入れていくことで、
142 | 読みやすいコードを書けるようになっていくと思います。
143 | 
144 | 
145 | =={sec-requirements-and-specification} 要件と仕様
146 | 
147 | 要件(Requirements) と仕様(Specification) という言葉はよく使われますが、
148 | その言葉を使う人や状況によって意味がブレている気がするので、
149 | 私なりの理解を簡単に説明しておきます。
150 | 
151 | 要件は、主にそのソフトウェアを使う人達が求める機能などについての
152 | 重要な側面を自然言語や図表などを用いて説明したものです。
153 | 機能についての側面は一番重要なので、機能要件という言葉があります。
154 | それ以外は非機能要件という言葉でまとめられてしまうこともありますが、
155 | 性能やセキュリティ、可用性、保守性、拡張性など色々とあります。
156 | 要件といったとき、全ての側面が網羅的に、具体的な実装が考えられるほど
157 | 詳細に語られているものであることはまずないと思って良いでしょう。
158 | ユースケース(そのソフトウェアの一部機能を使うことを含んだ業務や作業を表すキリの良い単位)
159 | が語られることが多いと思います。
160 | ソフトウェアを使う人達と作る人達は別々であることが多く、
161 | 主に使う人達に欲しいものは何かを聞いて整理し、欲しいものはこういうものですねと確認する段取りを
162 | 要件定義と呼ぶことが多いと思います。
163 | 
164 | 要件を満たすように、対象ソフトウェアのあるべき姿について網羅的に詳細を詰めていったものが仕様です。
165 | ソフトウェア設計という仕事の成果物だと考えても良いです。
166 | プログラムコードそのものを仕様という人はほぼいない(プログラムコードのことは実装=Implementationと呼ぶ)ので、
167 | 自然言語および図表などを使ったドキュメントで
168 | 仕様(の一部)を表現することが多いと思います。これを仕様書と呼びます。
169 | 仕様書と設計書とを分けて考える流儀もあるようですが、
170 | それを読んだり確認する人達のために、成果物を分ける場合もあると捉えるのが良さそうです。
171 | 
172 | 仕様書はどんな情報を含んでいるべきか、具体的に説明しましょう。
173 | まず第一に、ソフトウェアが様々な側面でどう分割されているのか、ということが書かれているべきです。
174 | 側面の例としては、モデルの分割(ユースケースを実現するためのデータや操作の抽象としてのモデル)、
175 | ソースコードの分割(関数、クラス、ライブラリ)、
176 | 動作単位の分割(スレッド、プロセス、サービス)、
177 | データの分割(種類、属性などによって区別)、
178 | 環境の分割(ネットワークセグメント、サーバ、拠点、など)、などです。
179 | どう分割するかは自明ではなく、むしろ設計の重要な決め事なのです@<fn>{footnote_ddd}。
180 | 分割されたそれぞれを、ここでは部品と呼ぶことにしましょう。
181 | 部品には通常名前がついています。どのような名前をつけるかも設計の範疇です。
182 | 
183 | //footnote[footnote_ddd][DDD という手法は、ソフトウェアをどう分割すべきかについて延々と議論しています。]
184 | 
185 | 
186 | 仕様書に書かれているべきことの第二は、
187 | 部品についての性質や振舞についての説明、部品同士の依存関係や相互作用の有無やそのあり方、
188 | 部品同士(や外部のソフトウェアやハードウェアと)のやりとり(通信、呼び出し)があるならその形式や手続、
189 | 部品とソフトウェアを使う人間とのやりとり(表示画面の構成や入力方法、それらの制限など)、
190 | あたりです。それぞれについて何であって何でないかを書く、という指針があるようです。
191 | 
192 | 仕様書について書かれているべきことの第三は、
193 | 部品やその相互作用を通じて要件がどのように満たされるかについてです。
194 | ソフトウェアのあるべき姿は要件を満たすことが目的ですから、
195 | それについて十分な説明があり、読む人が納得できることが必要でしょう。
196 | 
197 | 仕様変更という言葉の存在が仕様書に書いてあるべきことの性質を良く表していると思います。
198 | 仕様が変更されるとき、変更されたのとは別の部分にも変更が必要となることがあります。
199 | 仕様変更の影響範囲がどこまでなのか、システム全体が矛盾なく機能するように、何をどう直さないといけないのか、
200 | これをハッキリさせる必要があります。
201 | また、仕様変更の影響範囲が要件にまで及ぶこともあるでしょう。
202 | それらを検討し、ソフトウェアのあるべき姿を一貫性を欠くことなく見直すための道具としての側面が
203 | 仕様書にはあると思います。
204 | 
205 | 仕様書は、仕様について網羅的に書いてあるべきではあるけれども、
206 | 仕様の全てが記述されているものでもないと思います。
207 | 成果物としての仕様書を作成する場合でも、どこまで詳細に決めるか、書くかは程度問題だということです。
208 | ひとつの極端な場合として、その仕様書を元に実装すれば、誰が実装しても出来るものはそんなに変わらないだろうと
209 | 概ね期待できるもの、という基準があると思いますが、本当にそこまでコストをかけて仕様書を作っている
210 | プロジェクトがどれだけあるのか、私は疑問を持っています。
211 | (具体例を知らないのでそこまでコストをかけて作っている人がもしいたらゴメンナサイ)。
212 | 
213 | 実装(ソフトウェアコード)が仕様情報を全て含んでいるかと言われるとそういうわけでもありません。
214 | 実装は、主にコンピュータへの命令(アルゴリズム)としての表現を使って、仕様を満たすように作られます。
215 | しかし、仕様を満たすことは、必ずしも仕様について表現されていることを意味しません。
216 | さすがにまったく仕様情報がないとコードレビューにすら支障をきたす
217 | (実装の正しさとは仕様を満たすことで、コードレビューはそれを確認する行為です)ので、
218 | 関係ある仕様についての情報は、ソースコードコメント内で、自然言語による説明や仕様書の該当部分への参照として表現されます。
219 | 極端な場合には、仕様書などなく、ソースコードコメントにしか仕様情報が書かれていないこともありますし、
220 | 設計および実装をした人の頭の中にしか仕様情報がないこともあります(そして、忘れてしまっていることも)。
221 | 実装の視点から仕様を見れば、実装するために仕様が定まっている必要があるだけで、
222 | 仕様はソフトウェアの実体ではなく、あくまで抽象だといえるでしょう。
223 | 
224 | ソフトウェアを作る一連の流れは、要件の検討という概要から出発して仕様と呼ばれるものに
225 | 向かって徐々に詳細が固まっていき、プログラムコードとしての実装に至る、
226 | という捉え方ができると思います。
227 | すると、実装時に矛盾や問題が発覚し、仕様や要件まで戻って考え直す必要が出てくる
228 | こと(いわゆる要件見直し、仕様変更と呼ばれる出戻り)が不思議でもなんでもない
229 | 当たり前の出来事であることが分かるでしょう。
230 | 対象となるソフトウェアのあるべき姿とその実装方法を完璧に見通せていたならば
231 | 出戻りはないのかも知れませんが、それが分かってない状況から始まるのが典型的な設計という行為でありますので、
232 | 出戻りがないソフトウェア開発というのは理想ではあっても現実ではないでしょう。
233 | 
234 | 
235 | 
236 | 
237 | =={sec-about-test} テストについて
238 | 
239 | コードを書いたり修正したときにとりあえず(手動でも良いから)動作確認をする行為をスモークテストというそうです。
240 | スモークテストはそれはそれでとても大事なテストです。
241 | 一方、私がここで話題にしたいものは、リグレッションテストと呼ばれています。
242 | リグレッションテストとは、それまで期待通りに動いていたはずの機能がコード修正によって意図せず壊れたとき、
243 | それに出来るだけ早く気付くためのテストです。
244 | ですから、
245 | 
246 |  1. コードを変更したときにすぐに実行してパスするかどうかを確認できること
247 |  2. CI (Continuous Integration) ツールなどで自動化できること(テストの準備や実行をするスクリプト等の用意、テスト結果もコマンドの返り値などで判別できるようになっていること)
248 | 
249 | が必要になります。
250 | 今回、CI で動かす必要が必ずしもあるかは分かりませんが、
251 | たとえば @<tt>{make utest} などと実行したらすぐにテストが走るようにしておくことが重要です。
252 | 
253 | 私は、C++ でプログラムを書く場合、同僚の作ってくれた簡易なヘルパ関数を使ってテストを作り、
254 | それを @<tt>{make utest} で動かせるようにしています。
255 | 
256 |  * @<href>{https://github.com/herumi/cybozulib/blob/master/include/cybozu/test.hpp}
257 | 
258 | C++ 向けのテストフレームワークの有名所としては Google Test が挙げられるでしょう。
259 | 
260 |  * @<href>{https://github.com/google/googletest}
261 | 
262 | 比較的新しい言語 (Go とか Rust とか) には公式のテストフレームワークが用意されていることが多いと思います。
263 | 余程の事情がなければそれに従っておけば良いと思います。
264 | 
265 | 原則としては、終了コードでパスしたかどうかを判別できるようなテストプログラムを
266 | テストしたい項目毎に書けば良いと思います。
267 | もう少し複雑なテストをしたい場合は、環境や入力データの作成、テスト実行、
268 | 結果のチェックなどをする専用のスクリプトを書いたりします。
269 | これもコマンド一発で動かせて、成功失敗を返り値などでチェックできるようにしておけば CI で動かせます。
270 | 
271 | 実運用で使う、バグを踏むとものすごく困ったことになる、
272 | メンテナンスを少なくとも数年続ける必要があるようなプログラムと違って、
273 | 今回のような学習用、プロトタイピング的なプログラムを作る場合に、このようなテストにたくさん時間をかけたくないでしょう。
274 | ただ、何回も実行するのが面倒くさいと人間はサボるようになりますから、
275 | 何回も実行する必要があるテストは自動化しておきましょう。
276 | 本書に出てくる機能を例に挙げると、Crash recovery は事ある度にテストして欲しいです。
277 | また、データ構造とアルゴリズムのコードは、比較的テストしやすい一方で
278 | 複雑であるためバグを入れてしまいやすいです。
279 | よって、積極的にテストコードを書きましょう。
280 | ファイル操作やネットワーク通信など外部とのやりとりが絡むコードをテストするのは
281 | 相対的に面倒くさいです。部品毎のテストが無理そうなら、多少大きな単位になってしまっても、
282 | テストしやすい粒度でテストしてください。
283 | 
284 | 目安として、自分が複雑だと感じるコードや機能については、まず間違いなくテストが必要です。
285 | 色々な状態や入力に対して動くかなあ、と不安になったらテストの書き時です。
286 | 経験則として、そのようなコードは大抵の場合バグっています。
287 | もしテストを書かなくても大丈夫だと安心していたコードがバグっていたことが判明したら、
288 | あなたの安心を感じるセンサーを修正する必要があります。
289 | 
290 | バグが入りにくい設計、実装を心がけることが重要なのはいうまでもありません。
291 | しかし、バグがないプログラムなどない、と言われるくらいにバグは身近なものですから、
292 | 品質の良いソフトウェアはテストについての実践と切っても切りはなせません。
293 | 
294 | 
295 | 
296 | 
297 | =={sec-recoverability} Recoverability や Strong recoverability について
298 | 
299 | 
300 | DBMS は最低でも Recoverability (RC) を満たす必要がありますが、
301 | RC のみを満たそうとすると、Cascading aborts (Abort 処理の連鎖) 機構を
302 | DBMS に持たせる必要があるので、設計実装の複雑さやそれに伴うオーバーヘッドを考慮すると
303 | オススメできません。昔はあったようですが、現代の DBMS プロダクトで Cascading aborts 機構を供えている
304 | ものは少ないです(例外として Hekaton という DBMS があります)。
305 | 
306 | Cascading aborts を防ぐには、トランザクション A が書いた Record を
307 | トランザクション B が読もうとするとき、A が Commit するまで待てば良いです。
308 | この制約を Avoiding cascading aborts (ACA) といいます。ACA を満たせば RC も満たします。
309 | 
310 | ACA だけだと Crash recovery 時に処理が複雑になります。
311 | 具体的には、トランザクション A がある Record を書いた後、トランザクション B が同一 Record を
312 | 書き、A のみ Abort 扱いで B が Commit 扱いになった場合です。
313 | この場合、A の Undo 処理の後に B の Redo 処理を行う必要があります。
314 | B の Redo よりも A の Undo を後で行うと、
315 | B の書いたデータが A の Undo 処理によって消えてしまう可能性があるからです。
316 | まとめて Redo した後、まとめて Undo するというより単純な Crash recovery を実現するには、
317 | A が Commit するまで B が書くのを待てば良いです。ACA にこれを加えた制約を
318 | Strictness (ST) といいます。
319 | 
320 | Crash recovery が目的であれば ST で十分です。
321 | しかし、もっと強い制約が必要なケースがあります。
322 | それは Log を他のホストにレプリケーションして、適用し、レプリカ側で Read-only トランザクションを実行する
323 | ような構成です。
324 | 問題が起きるのはトランザクション A がある Record を読んだ後、トランザクション B が同一 Record を上書きし、
325 | しかし Commit 順は B < A となってしまった場合です。
326 | このときレプリケーション先で B までの Log を適用し A の Log がまだ適用されていない
327 | データベースは一貫性のある状態とはいえません。
328 | レプリケーション元では A < B つまり A の後に B が実行されたことになっており、
329 | B < A に基づいた順序が具現化することは Serializability の文脈では許容されないのです。
330 | この問題を防ぐためには、やはり A の Commit を待ってから B は上書きする必要があります。
331 | ST にこれを加えた制約を Rigorousness (RG) といいます。
332 | 詳しくは、Transactional Information Systems 本の 11.4 節 Sufficient Syntactic Conditions
333 | を参照ください。RC/ACA/ST/RG についての詳細が知りたい方には以下の論文が参考になると思います。
334 | 
335 |  * A theory of reliability in database systems
336 |  ** @<href>{https://dl.acm.org/doi/10.1145/42267.42272}
337 |  ** Journal of the ACM, Volume 35, Issue 1, Jan. 1988.
338 |  ** RC/ACA/ST について議論している論文。
339 |  * On rigorous Transaction Scheduling
340 |  ** @<href>{https://dl.acm.org/doi/abs/10.1109/32.92915}
341 |  ** IEEE Transactions on Software Engineering, Volume 17, Issue 9, September 1991.
342 |  ** RG について議論している論文。
343 | 
344 | 
345 | 
346 | 上記の議論は、Single-version model を前提にした議論で、Concurrency control の詳細に
347 | 踏み入った議論が含まれています(特に、ACA や ST、RG の話)。
348 | 本来この話はもう少し単純です。最近私が整理している理論によれば、
349 | Commit の依存関係が含まれる順序での実行結果を再現できれば、Recoverable といえます。
350 | また、Serialization order に基づいた順序で実行結果を再現できれば、Strong recoverable といえます。
351 | (RG は Strong recoverability を満たすと考えて良いです)。
352 | もちろん前提として、Committed なものは実行済みとして結果に含まれる必要はあります。
353 | Crash recovery の要件であれば Recoverable を、レプリカ上の Read-only アクセスも含めて Serializable に
354 | 動かしたい場合は Strong recoverable を採用すれば良いです。
355 | 
356 | 最近のインメモリ DBMS では Commit 操作が Pre-commit (Concurrency control による処理が完了)と
357 | Log の永続化に分離されている設計が多く、
358 | Commit を待って読み書きする、という言葉が言葉通りに解釈できないことがありますのでご注意ください。
359 | Pre-commit 操作と Log 永続化操作を分離する設計では、
360 | Serialization order もしくはそれに相当する情報を何らかの方法で WAL データに記録し、
361 | 後で必要な制約(Recoverability や Strong recoverability など)を満たす
362 | Commit order を再現して Crash recovery を実行する仕組みが使われます。
363 | 
364 | 
365 | 
366 | 
367 | #@#== プログラムのセキュリティ原則について
368 | 
369 | #@#未執筆。
370 | 
371 | #@#入力を受けいれるお作法について。外部入力はチェックが基本(assert ではなく)。
372 | #@#何を信頼して何を信頼しないのか、の判断基準は設計に反映される必要があるという話。
373 | 
374 | #@#かもしれない設計、かもしれない実装の心掛けについて。
375 | 
376 | 
377 | #@#== 論文を読む
378 | 
379 | #@#未執筆。
380 | #@#主に国際会議を列挙する。読み方についてもついでに書く。
381 | 
382 | #@#== トランザクショナルメモリについて
383 | 
384 | #@#未執筆。
385 | #@#External consistency (Linearizaiblity 相当) の話。
386 | #@#Opacity の話。
387 | 
388 | 
389 | #@#== Read-set と Write-set の管理について
390 | 
391 | #@#未執筆。
392 | 
393 | #@#== ベンチマークソフトウェアについて
394 | 
395 | #@#未執筆。YCSB やら TPC-C やら TPC-E やら、他にも。
396 | 
397 | #@#== In-memory DBMS と Disk-based DBMS の違い
398 | 
399 | #@#未執筆。
400 | 
401 | #@#== 分散 DBMS について
402 | 
403 | #@#未執筆。
404 | #@#合意の話について書く。(Replica) Consistency についての話も。
405 | 


--------------------------------------------------------------------------------
/preface.re:
--------------------------------------------------------------------------------
  1 | = はじめに
  2 | 
  3 | == データベースシステムとは
  4 | 
  5 | 
  6 | データベースとはデータの集まりで、特に整理整頓されているデータの集まりを指すこ
  7 | とが多いです。データベースの操作とは、その中に含まれるデータを検索した
  8 | り、追加、編集、削除したり、まとめて集計加工をしたりすることを指します。
  9 | 
 10 | データベースシステムとは、データベースの管理やユーザおよびアプリケーショ
 11 | ンによる操作を受け負うソフトウェアのことを指します。ひとりで使うデータ
 12 | ベースであれば、Excel などの表計算ソフトでも足りることが多いと思います。
 13 | これもデータベースシステムと呼べるでしょう。一方、複数人で共有したいデー
 14 | タベースの場合、同時に同じデータを更新したらデータが壊れたりおかしくなっ
 15 | たりしないか気になりますね。そのような心配をしなくていいのが典型的なデー
 16 | タベースシステムです。
 17 | 
 18 | データベースシステムといったとき、皆さんは具体的にどんなソフトウェアを
 19 | 思い浮べるでしょうか？オープンソースのデータベースシステムだけとっても、
 20 | MySQL、PostgreSQL など、商用だと Oracle、SQL Server、DB2、Google
 21 | Spannar、Amazon Aurora など、たくさんあります。
 22 | これらの多くは SQL@<fn>{footnote_sql} という操作インターフェースを供えており、
 23 | トランザクション処理が可能です。
 24 | また、大量のデータを加工・集計する処理も、規模や状況によりますが可能です。
 25 | 
 26 | //footnote[footnote_sql][日本語では「エスキューエル」と読む人が多いようですが、英語だと「シークエル」と呼ぶ人が多いらしいです。]
 27 | 
 28 | 
 29 | もう少し広い範囲でも見てみることにします。Hadoop や Spark などは、細か
 30 | い単位でのデータ操作が苦手で、とりわけトランザクション処理には対応して
 31 | いない代わりに、SQL SELECT 文もしくはそれに相当する実行、つまり、デー
 32 | タを大量に加工、集計する用途に特化しています。また、ひとつのホストでは
 33 | 保持できない程の大量のデータを扱えるように、複数のホストをまたがって動
 34 | 作する分散システムです。etcd は、設定情報を分散システムで安全に共有す
 35 | る目的で使われることが多いデータベースシステムですが、Key-value store
 36 | に分類されます。Key-value store は、主に Key を指定して、Value を検索、
 37 | 操作するという、SQL よりも単純なインターフェースを持っています。
 38 | Key-value store に分類される Memcached や Redis は、データの永続化をあ
 39 | る程度犠牲にしてでも、高速に処理したいデータを扱う目的で使われることが
 40 | 多いようです。他にも、目的、用途に応じて様々なデータベースシステムがあ
 41 | ります。
 42 | 
 43 | 
 44 | == トランザクション処理
 45 | 
 46 | 本書は、上記で紹介した様々なデータベースシステムの一部が持っている機
 47 | 能であるトランザクション処理を対象とします。トランザクション処理は世
 48 | の中になくてはならない処理のひとつです。皆さんが銀行 ATM でお金を入出
 49 | 金したり送金したりする度に、裏でトランザクションが実行されます。ATM
 50 | での操作が「きちんと」実行されないと困りますよね。また、皆さんがインター
 51 | ネット上の販売サイトで何かを購入するときに、決済(支払い)の画面で、決済
 52 | ボタンを押す度に、裏でトランザクションが実行されます。これらの操作も
 53 | 「きちんと」処理してくれないと困りますよね。お金のやりとりにはほぼ必須
 54 | ですが、それに限らず様々なやりとりでトランザクション処理は必要とされて
 55 | います。世の中には「きちんと」処理してくれないと困るデータが多いからで
 56 | す。「きちんと」がどういう意味を持つかについて理解するには、ACID 特性
 57 | の理解が必要となります。興味を持った方は自分で調べてみてください。
 58 | 
 59 | トランザクション処理の重要性について書きましたが、本書が書かれた一番の
 60 | 理由は、著者が、トランザクション処理をおもしろい、と思っているからです。
 61 | 
 62 | 
 63 | == トランザクション処理を学ぶのに向いている人
 64 | 
 65 | アルゴリズムとデータ構造を学ぶのがおもしろいと思う方は、トランザクショ
 66 | ン処理もおもしろいと感じる適性が間違いなくあると思います。何故ならトラ
 67 | ンザクション処理は、メモリ上、ディスク上で、様々なデータ構造を必要とし、
 68 | その操作に伴うアルゴリズムを必要とするからです。並列プログラミングが大
 69 | 好きな人も、トランザクション処理の性能を高めるために、それを駆使する必
 70 | 要があるので、楽しいと思います。CPU やメモリ、ストレージデバイス、ネッ
 71 | トワークデバイスなどのハードウェアに興味がある人にも、トランザクション
 72 | 処理(に限らずデータ処理全般)はハードウェアの機能や特性をいかに活用する
 73 | かという側面がありますので、楽しめると思います。
 74 | 
 75 | 
 76 | == 本書の目的
 77 | 
 78 | 
 79 | 本書によって、データベースシステム、とりわけトランザクション処理の大ま
 80 | かな仕組みを理解し、作る側になれる人を増やしたいと思っています。
 81 | 
 82 | SQL についての情報はたくさんあります。本もたくさん出ています。それはデー
 83 | タベースシステムを使う人に必要な知識で、データベースシステムを使う人は
 84 | たくさんいるからです。トランザクションを伴うアプリケーションを設計実装
 85 | する人達は、ひとまとめにしたい複数のデータベース操作をひとつのトランザ
 86 | クションにまとめるだけで済むことが多いと思います。トランザクションとい
 87 | う概念のもたらす抽象化は良く出来ており、使う側にとっては便利な道具です。
 88 | 一方で、その皺寄せがトランザクション処理を実行するデータベースシステム
 89 | に来ているのです。
 90 | 
 91 | データベースシステムを作れるであろう人は、私が思うに少ないです。もちろ
 92 | ん、使う人ほど多くなくていいですが、作る人がもっといて欲しいなと思いま
 93 | す。さらに、データベースシステムの作り方を教える人も少ないと思います。
 94 | というわけで、微力ではありますが多少の心得がある私が本書を書くことによっ
 95 | て多少なりとも目的に向かえたらなと思います。
 96 | 
 97 | 
 98 | == 本書で学べること
 99 | 
100 | 
101 | 本書を読む皆さんには、トランザクションを処理する仕組みについて実際にプ
102 | ログラムを作ることを通して学んでもらいます。
103 | 
104 | トランザクションを実行するのに必要な主な仕組みは、メモリ上およびディス
105 | ク上でデータに効率良くアクセスするためのアクセスメソッド(インデクス構
106 | 造)、効率的に更新データを永続化する永続化機構 (Write-ahead logging,
107 | WAL やCheckpointing)、およびトランザクションを同時にたくさん実行するた
108 | めの並行実行制御(Concurrency control, CC) です。
109 | 
110 | 私がおもしろく、そして難しいと思うところは、トランザクションを並列に実
111 | 行するための、様々な仕組みで、Concurrency control はそのひとつです。た
112 | だ、Concurrency control をデータベースシステム上で実現するにあたって、
113 | 典型的には複数の CPU コアを使ってトランザクションを並列に実行するので
114 | すが、複数スレッド/プロセスからひとつのデータ構造にアクセスするので、
115 | 並列プログラミングと言われている技術が必要になります。具体的には Lock
116 | や Latch などデータの適切な排他を行う仕組みが、場合によっては、
117 | Lock-free だとか Mutex-free と呼ばれているような技術も必要です。
118 | 
119 | 並列プログラミングにチャレンジするかどうかは皆さん次第ではありますが、
120 | これらの技術的に難易度が高めの能力を前提としてしまうのは、本書の目的に
121 | 必ずしも沿わないと思います。
122 | 
123 | そこで、並列処理にチャレンジする前に到達して欲しいマイルストーンとして、
124 | シングルスレッドで、基本的なトランザクション処理ができるデータベースシ
125 | ステムが動くことを目指して欲しいと思います。シングルスレッドプログラム
126 | に対象を絞ったときは、初めに、ディスク、つまり永続ストレージの特性と操
127 | 作について、次にデータ構造(主にアクセスメソッドとしてのインデクス)、そ
128 | して WAL (と Checkpointing) について学んでもらいます。ここまでを実装す
129 | ると、クラッシュリカバリができるようになり、最低限のトランザクション処
130 | 理ができるデータベースシステムですよといえるようになります。
131 | 
132 | 次なるステップとして、Concurrency control について学んでもらおうと思っ
133 | ています。これには、2 つのアプローチがあります。ひとつめは、カーネルス
134 | レッドではなく、ユーザースレッドもしくはそれに準ずる手法を用いて、
135 | Concurrency control の仕組みを実装し、動かしながら学んでもらうアプロー
136 | チです。このアプローチの良いところは、スレッドセーフなデータ構造を使っ
137 | たり並列プログラミングの技法を駆使しなくても Concurrency control を動
138 | かせることです。ふたつめは、既存のスレッドセーフなデータ構造ライブラリ
139 | を使って、複数のカーネルスレッドで動かすことを前提に Concurrency
140 | control の手法を実装するアプローチです。こちらは、Concurrency control
141 | 実装に並列プログラミングが必要となります。ここまでで、一通りトランザク
142 | ション処理の要素技術を学べると思います。
143 | 
144 | 
145 | 
146 | == 前提となる知識と経験
147 | 
148 | プログラミングをまったくやったことがない方は本書を読んでもチンプンカン
149 | プンとなる可能性が高いです。なんでも構わないので、プログラムの書き方
150 | (変数だの関数だの分岐だのループだのファイル操作などなど)に慣れ、基本的
151 | なデータ構造とアルゴリズム(配列、リスト、マップ、サーチ、ソート、など
152 | など)に慣れてからの方が良いでしょう。
153 | 
154 | プログラムの書き方について、具体的には、データの種類および入れ物である
155 | 型と変数について、処理の単位である関数について、分岐やループなどプログ
156 | ラムの構造について、ファイル操作などの入出力について、ある程度知ってい
157 | て慣れている必要があります。C/C++ などを使う場合は、さらにポインタの使
158 | い方やヒープとスタックの違いについてなどを知っていると良いでしょう。
159 | 
160 | 基本的なアルゴリズムとデータ構造については、Tree map 構造と Hash table
161 | 構造をインデクスとして使ったときの特性の違いだとか、Search と Sort ア
162 | ルゴリズムだとかについて知っていると良いです。分からなければ、必要に応
163 | じて学べば良いです。
164 | 
165 | 開発に用いるプログラミング言語について。データベースシステムは、C/C++
166 | などのよりメモリや CPU を直接扱いやすい言語で書いてあることが多いです
167 | し、最近ですと、Go、Java などで書かれているものもあるようです。もちろ
168 | ん、上記の言語を使わないとダメというわけではありません。ただ、特にファ
169 | イルの操作については、システムコールを使って説明することも多いので、お
170 | 使いのプログラミング言語でどのようにそれらの処理が抽象化されているかに
171 | ついてはご自分で調べてください。
172 | ファイル操作については標準もしくはそれに準ずる
173 | ライブラリが用意されている言語が多いようなので、
174 | それを適切に使えば目的は達成できると思います。
175 | 
176 | 
177 | 
178 | == 本書を読んだ後
179 | 
180 | 本書で学んだ後、是非皆さんの興味が強いテーマを深欲りして欲しいと思いま
181 | す。たとえば、インデクス構造を自作したり、スレッドセーフにしたり、性能
182 | を追求するなど。WAL の仕組みを改善してみるなど、並列化してみるなど、
183 | Checkpointing を頑張ってみるなど。異なる Concurrency control 手法を実
184 | 装してみるなど。よりハードウェアの性能を活用できるような方法を考えてみ
185 | るなど。組込みシステムや分散システムなどの異なる環境を想定してみるなど。
186 | トランザクション処理とは違う視点、例えば、SQL 処理の最適化・並列化など
187 | や、ストレージ技術などに視野を広げて勉強するのも良いと思います。
188 | 
189 | 皆さんには、本書で学んだことを生かして、いずれ、是非オリジナルの特徴を
190 | 持ったデータベースシステムの開発にチャレンジしていただきたいですし、実
191 | 用的なデータベースシステムを作る側の人になって活躍して欲しいです。もち
192 | ろん、データベースシステムを使う側の人になったとしても、ここで得た知識
193 | は多いに役立つでしょう。どのような仕組みになっているかを知らないで使う
194 | のと、知っていて使うのでは、大きな差が出ます。データベースシステムの気
195 | 持ちを知らない人は、データベースシステムをうまく使うことが出来ません。
196 | また、研究の分野でもまだまだ課題はたくさんあり、それらを解決に導く新し
197 | い手法を探求していって欲しいとも思います。
198 | 
199 | データベースシステムは、秘密にしなければならないデータを格納することも
200 | 多いので、データの漏洩や改竄をされないように厳重に守らなければなりませ
201 | ん。その第一歩は、バグを出来るだけ少なくするような設計実装であることは
202 | いうまでもありませんが、データベースシステムそのものだけでなく、周辺環
203 | 境、使う人達のことも含めて、セキュリティには十分意識して頂きたいと思い
204 | ます。
205 | 
206 | 
207 | == 本書の構成
208 | 
209 | @<chap>{data}でデータベースが扱うデータとは何か、
210 | @<chap>{transaction}でトランザクションとは何かについて簡単にですが学びます。
211 | 使う側の視点で、トランザクションシステムは
212 | どんな性質を持っているとみなせるのかについて説明します。
213 | 
214 | @<chap>{indexes}でインデクスについて、
215 | @<chap>{wal}で永続化について、
216 | @<chap>{concurrency-control}で並行実行制御について学びます。
217 | これらは皆さんが作るトランザクションシステムの主要な仕組
218 | みでしたね。それぞれの役割や典型的な手法について紹介します。
219 | 
220 | @<chap>{file-io}ではファイルの読み書きを行う基本的な道具について学びます。
221 | この章はほぼ Linux 前提の知識で、関係する System call について紹介しています。
222 | お使いのプログラミング言語が良いライブラリを持っている場合はそちらを使
223 | いましょう。また、異なる OS 向けの設計実装したい場合は同様の API を調
224 | べて正しく使う必要があります。
225 | 
226 | @<chap>{atomic-write}では、データの Atomic な永続化方法について解説します。
227 | これは、ファイルの読み書きをする基本的な道具を使って、
228 | トランザクションシステムの設計実装をするために必要な典型的な手法について整理したものです。
229 | 
230 | @<chap>{basic-design}では、「DBMS を学ぶためのリファレンス設計 基本」というタイトル通り、
231 | 最小限、トランザクションシステムと呼べるもののリファレンス設計について
232 | 示します。ここではかなり永続化にウェイトが置かれています。
233 | そのための@<chap>{file-io}と@<chap>{atomic-write}だったんですね。
234 | とはいえ、あまり詳細には書いていない(書けていないともいう)ので、
235 | ご自分で細かいところを詰めながら作ってみてください。
236 | 
237 | @<chap>{next-step}は、「DBMS を学ぶためのリファレンス設計 応用」について説明します。
238 | @<chap>{basic-design}で作ったものを改造しながらさらに学んでいくにあたって、
239 | 複数の発展方向がありますので、それぞれについての指針を説明します。
240 | 
241 | @<chap>{memo}には、それまでの章に入れづらかったり、長くなりすぎた内容について、
242 | 順不同でまとめて置いてあります。
243 | 


--------------------------------------------------------------------------------
/sty/README.md:
--------------------------------------------------------------------------------
  1 | review-jsbook.cls Users Guide
  2 | ====================
  3 | 
  4 | 現時点における最新版 `jsbook.cls  2018/06/23 jsclasses (okumura, texjporg)` をベースに、Re:VIEW 向け review-jsbook.cls を実装しました。
  5 | 
  6 | 過去の Re:VIEW 2 で jsbook.cls で作っていた資産を、ほとんどそのまま Re:VIEW 3 でも利用できます。
  7 | 
  8 | ## 特徴
  9 | 
 10 |  * クラスオプション `media` により、「印刷用」「電子用」の用途を明示的な意思表示として与えることで、用途に応じた PDF ファイル生成を行えます。
 11 |  * （基本的に）クラスオプションを `<key>=<value>` で与えられます。
 12 |  * クラスオプション内で、用紙サイズや基本版面を設計できます。
 13 | 
 14 | ここで、クラスオプションとは、親 LaTeX 文章ファイルにおいて、以下のような位置にカンマ（,）区切りで記述するオプションです。
 15 | 
 16 | ```latex
 17 | \documentclass[クラスオプションたち（省略可能）]{review-jsbook}
 18 | ```
 19 | 
 20 | ## Re:VIEW で利用する
 21 | 
 22 | クラスオプションオプションたちは、Re:VIEW 設定ファイル config.yml 内の texdocumentclass において、以下のような位置に記述します。
 23 | 
 24 | ```yaml
 25 | texdocumentclass: ["review-jsbook", "クラスオプションたち（省略可能）"]
 26 | ```
 27 | 
 28 | ## 利用可能なクラスオプションたち
 29 | 
 30 | ### 用途別 PDF データ作成 `media=<用途名>`
 31 | 
 32 | 印刷用 `print`、電子用 `ebook` のいずれかの用途名を指定します。
 33 | 
 34 |  * `print`［デフォルト］：印刷用 PDF ファイルを生成します。
 35 |    * トンボあり、デジタルトンボあり、hyperref パッケージを `draft` モードで読み込み、表紙は入れない
 36 |  * `ebook`：電子用PDFファイルを生成します。
 37 |    * トンボなし、hyperref パッケージを読み込み、表紙を入れる
 38 | 
 39 | ### 表紙の挿入有無 `cover=<trueまたはfalse>`
 40 | 
 41 | `media` の値によって表紙（config.yml の coverimage に指定した画像）の配置の有無は自動で切り替わりますが、`cover=true` とすれば必ず表紙を入れるようになります。
 42 | 
 43 | ### 表紙画像のサイズの仕上がり紙面合わせ `cover_fit_page=<trueまたはfalse>`
 44 | 
 45 | 上記の coverimage で指定する画像ファイルは、原寸を想定しているため、サイズが異なる場合にははみ出たり、小さすぎたりすることになります。できるだけ原寸で用意することを推奨しますが、`cover_fit_page=true` とすれば表紙画像を紙面の仕上がりサイズに合わせて拡縮します。
 46 | 
 47 | ### 特定の用紙サイズ `paper=<用紙サイズ>`
 48 | 
 49 | 利用可能な特定の用紙サイズを指定できます。
 50 | 
 51 |  * `a3`
 52 |  * `a4` ［デフォルト］
 53 |  * `a5`
 54 |  * `a6`
 55 |  * `b4`：JIS B4
 56 |  * `b5`：JIS B5
 57 |  * `b6`：JIS B6
 58 |  * `a4var`：210mm x 283mm
 59 |  * `b5var`：182mm x 230mm
 60 |  * `letter`
 61 |  * `legal`
 62 |  * `executive`
 63 | 
 64 | ### トンボ用紙サイズ `tombopaper=<用紙サイズ>` および塗り足し幅 `bleed_margin=<幅>`
 65 | 
 66 | `tombopaper` ではトンボ用紙サイズを指定できます。
 67 | ［デフォルト］値は自動判定します。
 68 | 
 69 | `bleed_margin` では塗り足し領域の幅を指定できます。
 70 | ［デフォルト］3mm になります。
 71 | 
 72 | ### カスタム用紙サイズ `paperwidth=<用紙横幅>`, `paperheight=<用紙縦幅>`
 73 | 
 74 | カスタム用紙サイズ `paperwidth=<用紙横幅>`, `paperheight=<用紙縦幅>` （両方とも与える必要があります）を与えることで、特定の用紙サイズで設定できない用紙サイズを与えられます。
 75 | 
 76 | たとえば、B5変形 `paperwidth=182mm`, `paperheight=235mm`。
 77 | 
 78 | ### 基本版面設計 `fontsize=<文字サイズ>`, `baselineskip=<行送り>`, `line_length=<字詰>`, `number_of_lines=<行数>`, `head_space=<天>`, `gutter=<ノド>`, `linegap=<幅>`, `headheight=<幅>`, `headsep=<幅>`, `footskip=<幅>`
 79 | 
 80 | 基本版面情報を与えます。
 81 | 天、ノドをそれぞれ与えない場合、それぞれ天地、左右中央になります。
 82 | 
 83 |  * `fontsize=10pt`［デフォルト］：標準の文字（normalfontsize）の文字サイズを与えます。pt のほか、Q や mm といった単位も指定可能です。ただし、文字サイズは jsbook の挙動に合わせるために 8pt, 9pt, 10pt, 11pt, 12pt, 14pt, 17pt, 20pt, 21pt, 25pt, 30pt, 36pt, 43pt のいずれか近いサイズに丸められます。
 84 |  * `baselineskip=16pt`［デフォルト］：行送りを与えます。
 85 |  * `line_length=<字詰め幅>`：1行字詰めを与えます。字詰め幅には単位を付ける必要があります。文字数であれば「zw」を使うとよいでしょう（例：35zw＝35文字）。デフォルトでは jsbook の挙動に従い、紙サイズに基いて決定します。
 86 |  * `number_of_lines=<行数>`：行数を与えます。デフォルトでは jsbook の挙動に従い、紙サイズに基いて決定します。
 87 |  * `head_space=<幅>`：天を与えます。［デフォルト］は天地中央です。
 88 |  * `gutter=<幅>`：ノドを与えます。［デフォルト］は左右中央です。
 89 |  * `linegap=<幅>`：行送りを baselineskip で指定する代わりに、通常の文字の高さにこのオプションで指定する幅を加えたものを行送りとします。
 90 | 
 91 | 例をいくつか挙げます。
 92 | 
 93 |  * `paper=a5, fontsize=10pt, line_length=35zw, number_of_lines=32, baselineskip=16pt,`
 94 |  * `paper=b5, fontsize=13Q, baselineskip=20.5H, head_space=20mm, gutter=20mm,`
 95 | 
 96 | さらに、ヘッダー、フッターに関する位置調整は、TeX のパラメータ `\headheight`, `\headsep`, `\footskip` に対応しており、それぞれ `headheight`, `headsep`, `footskip` を与えられます。
 97 | 
 98 | ## 開始ページ番号 `startpage=<ページ番号>`
 99 | 
100 | 大扉からのページ開始番号を指定します。
101 | 
102 | ［デフォルト］は1です。表紙・表紙裏（表1・表2）のぶんを飛ばしたければ、`startpage=3` とします。
103 | 
104 | ## 通しページ番号（通しノンブル） `serial_pagination=<trueまたはfalse>`
105 | 
106 | 大扉からアラビア数字でページ番号を通すかどうかを指定します。
107 | 
108 |  * `true`：大扉を開始ページとして、前付（catalog.yml で PREDEF に指定したもの）、さらに本文（catalog.yml で CHAPS に指定したもの）に連続したページ番号をアラビア数字で振ります（通しノンブルと言います）。
109 |  * `false`［デフォルト］：大扉を開始ページとして前付の終わり（通常は目次）までのページ番号をローマ数字で振ります。本文は 1 を開始ページとしてアラビア数字で振り直します（別ノンブルと言います）。
110 | 
111 | ### 隠しノンブル 'hiddenfolio=<プリセット>'
112 | 
113 | 印刷所固有の要件に合わせて、ノドの目立たない位置に小さくノンブルを入れます。
114 | 'hiddenfolio` にプリセットを与えることで、特定の印刷所さん対応の隠しノンブルを出力することができます。
115 | 利用可能なプリセットは、以下のとおりです。
116 | 
117 |  * `default`：トンボ左上（塗り足しの外）にページ番号を入れます。
118 |  * `marusho-ink`（丸正インキ）：塗り足し幅を5mmに設定、ノド中央にページ番号を入れます。
119 |  * `nikko-pc`（日光企画）, `shippo`（ねこのしっぽ）：ノド中央にページ番号を入れます。
120 | 
121 | 独自の設定を追加したいときには、review-jsbook.cls の実装を参照してください。
122 | 
123 | ページ番号は紙面に入れるものと同じものが入ります。アラビア数字で通したいときには、上記の `serial_pagination=true` も指定してください。
124 | 
125 | ## 標準で review-jsbook.cls を実行したときの jsbook.cls との違い
126 | 
127 |  * jsbook.cls のクラスオプション `uplatex`：これまで texdocumentclass に指定が必要だった `uplatex` オプションは不要となっています。
128 |  * jsbook.cls のクラスオプション `nomag`：用紙サイズや版面設計は、review-jsbook.cls 側で行います。
129 |  * hyperref パッケージ：あらかじめ hyperref パッケージを組み込んでおり、`media` オプションにより用途別で挙動を制御します。
130 | 
131 | ### 既存の jsbook.cls のオプションの扱い
132 | 
133 | review-jsbook.cls は jsbook.cls を包んでおり、一部の jsbook.cls のクラスオプションはそのまま指定可能です。
134 | 
135 |  * `oneside`: 奇数ページ・偶数ページで柱やページ番号などを同じ体裁にします。review-jsbook.cls にも有効ですが、review-style.sty でこれを打ち消し奇数・偶数で別の見た目にするデザイン (fancyhdr) が定義されているので、review-style.sty も調整する必要があります。
136 |  * `twoside`: 奇数ページ・偶数ページで柱やページ番号などを別の体裁にします (デフォルト)。
137 |  * `vartwoside`: twoside とおおむね同じですが、傍注が小口ではなく常に右側になります。Re:VIEW のデフォルトでは傍注は使用していないので、効果は通常表れません。
138 |  * `onecolumn`: 1段組の体裁にします (デフォルト)。
139 |  * `twocolumn`: 2段組の体裁にします。
140 |  * `openright`: 章の始まりを右ページ (奇数ページ) にします (デフォルト)。前の章が右ページで終わった場合には、白紙のページが1ページ挿入されます。
141 |  * `openleft`: 章の始まりを左ページ (偶数ページ) にします。前の章が左ページで終わった場合には、白紙のページが1ページ挿入されます。
142 |  * `openany`: 章の始まりを左右どちらのページからでも始めます。
143 |  * `draft`: 確認作業のために、overfull box が起きた箇所の行末に罫線を引き、画像は実際に貼り付けずにボックスとファイル名だけを表記するようにします。
144 |  * `final`: 上記の draft の処理を行いません (デフォルト)。
145 |  * `leqno`: 数式の番号を右ではなく左側に置きます。ただし Re:VIEW では LaTeX のやり方での採番付き数式を作っていないので、効果は通常表れません。
146 |  * `fleqn`: 数式をデフォルトの左右中央ではなく、左側に配置します。
147 |  * `english`: 英語ドキュメント向けに、字下げをなくしたり、「章」や「目次」などの定型の文字列を英語化します。しかし、Re:VIEW では定型文字列はロケールファイルで処理しており、ほとんどは無視されます。
148 |  * `jslogo`: 「LaTeX」等のロゴを置き換えます (デフォルト)。
149 |  * `nojslogo`: ロゴを置き換えません。
150 |  * `report`: oneside と openany の両方と同じ効果を持ちます。
151 |  * `landscape`: 用紙を横長で使います。review-jsbook.cls のクラスオプションで基本版面設計をやり直す必要があることに注意してください。
152 | 
153 | jsbook.cls の以下のクラスオプションは挙動が異なります。代わりに review-jsbook.cls のクラスオプションを利用してください。
154 | 
155 |  * `8pt`・`9pt`・`10pt`・`11pt`・`12pt`・`14pt`・`17pt`・`20pt`・`21pt`・`25pt`・`30pt`・`36pt`・`43pt`・`12Q`・`14Q`・`10ptj`・`10.5ptj`・`11ptj`・`12ptj`: 基本文字のサイズを指定します。そのまま review-jsbook.cls の fontsize に渡されますが、上記の fontsize クラスオプションの説明にあるとおり丸められます。
156 |  * `tombow`・`tombo`・`mentuke`: トンボや塗り足しを作成しますが、これらは PDF 入稿に求められる正しいデジタルトンボ情報を入れないので使用してはなりません。review-jsbook.cls の `media=print` を使ってください。
157 |  * `a4paper`・`a5paper`・`b5paper`・`b4paper`・`letterpaper`: 紙サイズを指定します。誤りではありませんが、review-jsbook.cls の paper クラスオプションを使うほうが妥当です。
158 | 
159 | jsbook.cls の以下のクラスオプションは無視またはエラーになります。
160 | 
161 |  * `uplatex`: 暗黙に指定されるので無視されます。
162 |  * `autodetect-engine`: pLaTeX/upLaTeX を自動判別するオプションですが、Re:VIEW では review-jsbook 利用時に upLaTeX を暗黙に前提としているので無視されます。
163 |  * `papersize`: dvips などに紙サイズ情報を与えるオプションですが、Re:VIEW ではこれを利用しないので、結果的に無視されます。
164 |  * `titlepage`・`notitlepage`: 表題の独立ページ化の有無ですが、Re:VIEW では表題を利用していないため、結果的に無視されます。
165 |  * `usemag`・`nomag`・`nomag*`: 用紙サイズと版面設計は review-jsbook.cls のクラスオプションを使うため、無視されます。
166 |  * `a4j`・`a5j`・`b4j`・`b5j`・`winjis`・`mingoth`: これらは無効としており、エラーになります。review-jsbook.cls のクラスオプションを利用してください。
167 |  * `jis`: jis フォントメトリックスを使う指定ですが、通常の環境ではコンパイルエラーになります。
168 |  * `disablejfam`: 数式内の利用フォント数を増やすために、数式内の日本語文字を使わないようにする指定ですが、Re:VIEW を利用する上では単にエラーを誘発するだけでしょう。
169 | 


--------------------------------------------------------------------------------
/sty/jumoline.sty:
--------------------------------------------------------------------------------
  1 | %%
  2 | %% This is file `jumoline.sty',
  3 | %% generated with the docstrip utility.
  4 | %%
  5 | %% The original source files were:
  6 | %%
  7 | %% jumoline.dtx  (with options: `package')
  8 | %% 
  9 | %% IMPORTANT NOTICE:
 10 | %% 
 11 | %% For the copyright see the source file.
 12 | %% 
 13 | %% Any modified versions of this file must be renamed
 14 | %% with new filenames distinct from jumoline.sty.
 15 | %% 
 16 | %% For distribution of the original source see the terms
 17 | %% for copying and modification in the file jumoline.dtx.
 18 | %% 
 19 | %% This generated file may be distributed as long as the
 20 | %% original source files, as listed above, are part of the
 21 | %% same distribution. (The sources need not necessarily be
 22 | %% in the same archive or directory.)
 23 | %% Style file `jumoline'.
 24 | %% Copyright (C) 1999-2001  Hiroshi Nakashima
 25 | %%        (Toyohashi Univ. of Tech.)
 26 | %%
 27 | %% This program can be redistributed and/or modified under the terms
 28 | %% of the LaTeX Project Public License distributed from CTAN
 29 | %% archives in directory macros/latex/base/lppl.txt; either
 30 | %% version 1 of the License, or any later version.
 31 | %%
 32 | %% \CharacterTable
 33 | %%  {Upper-case    \A\B\C\D\E\F\G\H\I\J\K\L\M\N\O\P\Q\R\S\T\U\V\W\X\Y\Z
 34 | %%   Lower-case    \a\b\c\d\e\f\g\h\i\j\k\l\m\n\o\p\q\r\s\t\u\v\w\x\y\z
 35 | %%   Digits        \0\1\2\3\4\5\6\7\8\9
 36 | %%   Exclamation   \!     Double quote  \"     Hash (number) \#
 37 | %%   Dollar        \$     Percent       \%     Ampersand     \&
 38 | %%   Acute accent  \'     Left paren    \(     Right paren   \)
 39 | %%   Asterisk      \*     Plus          \+     Comma         \,
 40 | %%   Minus         \-     Point         \.     Solidus       \/
 41 | %%   Colon         \:     Semicolon     \;     Less than     \<
 42 | %%   Equals        \=     Greater than  \>     Question mark \?
 43 | %%   Commercial at \@     Left bracket  \[     Backslash     \\
 44 | %%   Right bracket \]     Circumflex    \^     Underscore    \_
 45 | %%   Grave accent  \`     Left brace    \{     Vertical bar  \|
 46 | %%   Right brace   \}     Tilde         \~}
 47 | %%
 48 | %%
 49 | \def\next{LaTeX2e}
 50 | \ifx\fmtname\next
 51 | \def\next{
 52 | \NeedsTeXFormat{LaTeX2e}[1994/12/01]
 53 | \ProvidesPackage{jumoline}}
 54 | \else\def\next[#1]{}\fi
 55 | \next
 56 | [2001/05/31 v1.2 ]
 57 | 
 58 | \ifx\PackageError\undefined
 59 | \def\PackageError#1#2#3{\@latexerr{#1:#2}{#3^^J\@ehc}}
 60 | \fi
 61 | 
 62 | %%^L
 63 | 
 64 | %% Register Declaration
 65 | 
 66 | \newdimen\UnderlineDepth \UnderlineDepth-\maxdimen
 67 | \newdimen\MidlineHeight \MidlineHeight-\maxdimen
 68 | \newdimen\OverlineHeight \OverlineHeight-\maxdimen
 69 | \newdimen\UMOlineThickness \UMOlineThickness.4pt
 70 | 
 71 | \newdimen\UMO@height \newdimen\UMO@depth
 72 | \newdimen\UMO@dqspace \newdimen\UMO@tempdim
 73 | 
 74 | \newskip\UMO@prejfmglue \newskip\UMO@postjfmglue
 75 | 
 76 | \newcount\UMO@mode
 77 | \let\UMO@afterblock\z@
 78 | \let\UMO@afterword\@ne
 79 | \let\UMO@afterchar\tw@
 80 | 
 81 | \newcount\UMO@spacefactor
 82 | \newcount\UMO@firstxspcode
 83 | \newcount\UMO@lastxspcode
 84 | \newcount\UMO@inhibitxspcode
 85 | \newcount\UMO@prebreakpenalty
 86 | \newcount\UMO@postbreakpenalty
 87 | \newcount\UMO@kpostbreakpenalty
 88 | 
 89 | \newif\ifUMO@nospace \newif\ifUMO@firstelem
 90 | 
 91 | %%^L
 92 | 
 93 | %% User Interface and Initialization
 94 | 
 95 | \def\Underline{\UMO@line\UnderlineDepth{-\UnderlineDepth}{-\dp\strutbox}}
 96 | \def\Midline{\setbox\@tempboxa\hbox{あ}%
 97 |         \UMO@line\MidlineHeight\MidlineHeight{.5\ht\@tempboxa}}
 98 | \def\Overline{\UMO@line\OverlineHeight\OverlineHeight{\ht\strutbox}}
 99 | \def\UMOline{\UMO@line{-\maxdimen}\z@}
100 | 
101 | \def\UMO@line#1#2#3#4{\begingroup \let\\\UMOnewline
102 |         \relax\ifdim#1<\z@ \UMO@height#3\relax
103 |         \else \UMO@height#2\relax \fi
104 |         \UMO@depth-\UMO@height
105 |         \ifdim\UMO@height<\z@ \advance\UMO@depth\UMOlineThickness
106 |         \else                 \advance\UMO@height\UMOlineThickness \fi
107 |         \settowidth\UMO@dqspace{“}\advance\UMO@dqspace-1zw
108 |         \UMO@dqspace-\UMO@dqspace \divide\UMO@dqspace\tw@
109 |         \UMO@nospacetrue \UMO@firstelemtrue
110 |         \UMO@mode\UMO@afterblock
111 |         \ifvmode\leavevmode\fi
112 |         \def\@tempa{#4 }\edef\@tempb{\noexpand\@nil\space}%
113 |         \expandafter\expandafter\expandafter\UMO@wordloop
114 |                 \expandafter\@tempa\@tempb
115 |         \endgroup \UMO@aftergroup}
116 | 
117 | %%^L
118 | 
119 | %% Processing Word Elements
120 | 
121 | \def\UMO@wordloop{\UMO@ifbgroup\UMO@wordblock\UMO@iwordloop}
122 | \def\UMO@ifbgroup#1#2{\let\@tempa#1\let\@tempb#2\futurelet\@tempc\UMO@ifnc}
123 | \def\UMO@ifnc{\ifx\@tempc\bgroup \let\next\@tempa \else\let\next\@tempb \fi
124 |         \next}
125 | \def\UMO@wordblock#1{\UMO@spaceskip
126 |         \UMO@putbox\relax{#1}\UMO@nospacetrue \UMO@mode\UMO@afterblock
127 |         \UMO@spacefactor\@m \UMO@wordloop}
128 | \def\UMO@iwordloop#1 {\def\@tempa{#1}\ifx\@tempa\@nnil \let\next\UMO@end
129 |         \else
130 |         \ifx\@tempa\empty \UMO@nospacefalse
131 |         \else
132 |                 \UMO@spaceskip \UMO@mode\UMO@afterblock
133 |                 \def\UMO@theword{}\UMO@firstxspcode\m@ne
134 |                 \UMO@charloop#1\@nil \fi
135 |         \let\next\UMO@wordloop \fi
136 |         \next}
137 | 
138 | %%^L
139 | 
140 | %% Interword Spacing
141 | 
142 | \def\UMO@spaceskip{\ifUMO@nospace \UMO@nospacefalse \else
143 |         \ifdim\spaceskip=\z@
144 |             \@tempdima\fontdimen3\font\relax
145 |                 \multiply\@tempdima\UMO@spacefactor \divide\@tempdima\@m
146 |             \@tempdimb\fontdimen4\font\relax \multiply\@tempdimb\@m
147 |                 \divide\@tempdimb\UMO@spacefactor
148 |             \@tempskipa\fontdimen2\font plus\@tempdima minus\@tempdimb\relax
149 |         \else
150 |             \edef\@tempa{\the\spaceskip\space @ @ @ @ }%
151 |             \expandafter\UMO@setspaceskip\@tempa\@nil
152 |         \fi
153 |         \ifnum\UMO@spacefactor<2000\else
154 |                 \ifdim\xspaceskip=\z@ \advance\@tempskipa\fontdimen7\font
155 |                 \else \@tempskipa\xspaceskip
156 |         \fi\fi
157 |         \UMO@skip\@tempskipa \fi}
158 | \def\UMO@setspaceskip#1 #2 #3 #4 #5 #6\@nil{\@tempdima\z@ \@tempdimb\z@
159 |         \def\@tempa{#2}\def\@tempb{#3}%
160 |         \ifx\@tempa\UMO@plus \@tempdima#3\def\@tempa{#4}\def\@tempb{#5}\fi
161 |         \ifx\@tempa\UMO@minus \@tempdimb\@tempb\relax\fi
162 |         \multiply\@tempdima\UMO@specefactor \divide\@tempdima\@m
163 |         \multiply\@tempdimb\@m \divide\UMO@spacefactor
164 |         \@tempskipa#1 plus\@tempdima minus\@tempdimb\relax}
165 | \def\@tempa#1 #2 #3 #4 #5\@nil{\def\UMO@plus{#2}\def\UMO@minus{#4}}
166 | \@tempskipa1pt plus 2pt minus 3pt
167 | \expandafter\@tempa\the\@tempskipa\@nil
168 | 
169 | %%^L
170 | 
171 | %% Processing Characters
172 | 
173 | \def\UMO@charloop{\UMO@ifbgroup\UMO@charblock\UMO@icharloop}
174 | \def\UMO@charblock#1{\UMO@putword
175 |         \UMO@putbox\relax{#1}\UMO@mode\UMO@afterblock \UMO@spacefactor\@m
176 |         \UMO@charloop}
177 | \def\UMO@icharloop#1{\def\@tempa{#1}%
178 |         \ifx\@tempa\@nnil \UMO@putword \let\next\relax
179 |         \else\ifx\UMOspace#1\relax \UMO@putword \let\next\UMO@space
180 |         \else\ifx\UMOnewline#1\relax \UMO@putword \let\next\UMO@newline
181 |         \else
182 |         \ifnum`#1<256\relax \edef\UMO@theword{\UMO@theword#1}%
183 |                 \ifnum\UMO@firstxspcode<\z@
184 |                         \UMO@firstxspcode\xspcode`#1\relax
185 |                         \UMO@prebreakpenalty\prebreakpenalty`#1\relax
186 |                         \fi
187 |                 \UMO@lastxspcode\xspcode`#1\relax
188 |                 \UMO@postbreakpenalty\postbreakpenalty`#1\relax
189 |         \else \UMO@putword \UMO@putchar{#1}\UMO@spacefactor\@m\fi
190 |         \let\next\UMO@charloop \fi\fi\fi \next}
191 | \def\UMOspace{\PackageError{jumoline}%
192 |         {\string\UMOspace\space cannot be used here.}%
193 |         {\string\UMOspace\space can be used only in the argument of
194 |                 \string\Underline\space and its relatives.}}
195 | \def\UMOnewline{\PackageError{jumoline}%
196 |         {\string\UMOnewline\space cannot be used here.}%
197 |         {\string\UMOnewline\space can be used only in the argument of
198 |                 \string\Underline\space and its relatives.}}
199 | 
200 | %%^L
201 | 
202 | %% Put ASCII String
203 | 
204 | \def\UMO@putword{\ifx\UMO@theword\empty\else
205 |         \ifnum\UMO@mode=\UMO@afterchar
206 |                 \advance\UMO@kpostbreakpenalty\UMO@prebreakpenalty
207 |                 \penalty\UMO@kpostbreakpenalty
208 |                 \ifdim\UMO@postjfmglue>\z@ \UMO@skip\UMO@postjfmglue
209 |                 \else\ifodd\UMO@inhibitxspcode \ifodd\UMO@firstxspcode
210 |                         \UMO@skip\xkanjiskip \fi\fi\fi\fi
211 |         \setbox\@tempboxa\hbox{%
212 |                 \UMO@theword\global\UMO@spacefactor\spacefactor}%
213 |         \UMO@putbox\relax\UMO@theword \UMO@mode\UMO@afterword
214 |         \def\UMO@theword{}\fi \UMO@firstxspcode\m@ne}
215 | 
216 | %%^L
217 | 
218 | %% Put Kanji Letter
219 | 
220 | \def\UMO@putchar#1{%
221 |         \ifnum\UMO@mode=\UMO@afterchar \UMO@prejfmglue\UMO@postjfmglue
222 |         \else                          \UMO@prejfmglue\z@ \fi
223 |         \UMO@postjfmglue\z@
224 |         \ifnum`#1<\kuten"1001\relax\UMO@setjfmglue{#1}\fi
225 |         \@tempskipa\UMO@prejfmglue
226 |         \UMO@inhibitxspcode\inhibitxspcode`#1\relax
227 |         \@tempcnta\prebreakpenalty`#1\relax
228 |         \ifnum\UMO@mode=\UMO@afterchar
229 |                 \advance\@tempcnta\UMO@kpostbreakpenalty
230 |                 \ifdim\UMO@prejfmglue=\z@ \@tempskipa\kanjiskip \fi
231 |         \else\ifnum\UMO@mode=\UMO@afterword
232 |                 \advance\@tempcnta\UMO@postbreakpenalty
233 |                 \ifdim\UMO@prejfmglue=\z@
234 |                 \ifnum\UMO@lastxspcode>\@ne \ifnum\UMO@inhibitxspcode>\@ne
235 |                         \@tempskipa\xkanjiskip \fi\fi\fi\fi\fi
236 |         \penalty\@tempcnta
237 |         \edef\@tempa{\the\@tempskipa}\ifx\@tempa\UMO@zskip\else
238 |                 \UMO@skip\@tempskipa \fi
239 |         \UMO@putbox\inhibitglue{#1}%
240 |         \UMO@kpostbreakpenalty\postbreakpenalty`#1\relax
241 |         \UMO@mode\UMO@afterchar}
242 | \@tempskipa\z@
243 | \edef\UMO@zskip{\the\@tempskipa}
244 | \def\UMO@setjfmglue#1{%
245 |         \settowidth\@tempdima{あ#1}\settowidth\@tempdimb{あ\inhibitglue#1}%
246 |         \advance\@tempdima-\@tempdimb
247 |         \settowidth\UMO@tempdim{#1あ}\settowidth\@tempdimb{#1\inhibitglue あ}%
248 |         \advance\UMO@tempdim-\@tempdimb
249 |         \ifdim\@tempdima>\z@
250 |                 \ifdim\UMO@tempdim>\z@
251 |                         \@tempskipa\@tempdima minus\@tempdima\relax
252 |                         \UMO@postjfmglue\UMO@tempdim minus\UMO@tempdim\relax
253 |                 \else   \@tempskipa\@tempdima minus\UMO@dqspace\relax \fi
254 |                 \advance\UMO@prejfmglue\@tempskipa
255 |         \else \UMO@postjfmglue\UMO@tempdim minus\UMO@dqspace \fi}
256 | 
257 | %%^L
258 | 
259 | %% Draw Under/Mid/Overline
260 | 
261 | \def\UMO@putbox#1#2{\setbox\@tempboxa\hbox{#1#2#1}\@tempdima\wd\@tempboxa
262 |         \ifUMO@firstelem\else
263 |         \rlap{\vrule\@height\UMO@height\@depth\UMO@depth\@width\@tempdima}\fi
264 |         \box\@tempboxa
265 |         \ifUMO@firstelem \UMO@firstelemfalse
266 |         \llap{\vrule\@height\UMO@height\@depth\UMO@depth\@width\@tempdima}\fi}
267 | \def\UMO@skip#1{%
268 |         \leaders\hrule\@height\UMO@height\@depth\UMO@depth\hskip#1\relax}
269 | 
270 | %%^L
271 | 
272 | %% Explicit Spacing and Line Breaking
273 | 
274 | \def\UMO@space{\UMO@mode\UMO@afterblock
275 |         \@ifstar\UMO@sspace\UMO@ispace}
276 | \def\UMO@sspace#1{\vrule width\z@\nobreak\UMO@skip{#1}\UMO@charloop}
277 | \def\UMO@ispace#1{\@tempskipa#1\relax
278 |         \@ifstar{\@tempswafalse\UMO@iispace}{\@tempswatrue\UMO@iispace}}
279 | \def\UMO@iispace{\@ifnextchar[%]
280 |                               {\UMO@penalty}%
281 |                               {\UMO@skip\@tempskipa \UMO@charloop}}
282 | \def\UMO@penalty[#1]{\@tempcnta#1\relax
283 |         \if@tempswa
284 |                 \ifnum\@tempcnta<\z@ \@tempcnta-\@tempcnta \fi
285 |                 \ifcase\@tempcnta \or
286 |                         \@tempcnta\@lowpenalty \or
287 |                         \@tempcnta\@medpenalty \or
288 |                         \@tempcnta\@highpenalty \else
289 |                         \@tempcnta\@M \fi
290 |                 \ifnum#1<\z@ \@tempcnta-\@tempcnta \fi \fi
291 |         \penalty\@tempcnta \UMO@skip\@tempskipa \UMO@charloop}
292 | 
293 | \def\UMO@newline{\UMO@mode\UMO@afterblock
294 |         \@ifstar{\UMO@skip{0pt plus1fil}\break \UMO@charloop}%
295 |                                  {\hfil \break \UMO@charloop}}
296 | 
297 | %%^L
298 | 
299 | %% Finalization
300 | 
301 | \def\UMO@end{\ifnum\UMO@mode=\UMO@afterchar
302 |         \ifnum\UMO@kpostbreakpenalty>\z@
303 |                 \penalty\UMO@kpostbreakpenalty \fi
304 |         \ifdim\UMO@postjfmglue>\z@
305 |                 \UMO@skip\UMO@postjfmglue\fi \fi
306 |         \xdef\UMO@aftergroup{\ifnum\UMO@mode=\UMO@afterword
307 |                 \spacefactor\number\UMO@spacefactor\fi}}
308 | \endinput
309 | %%
310 | %% End of file `jumoline.sty'.
311 | 


--------------------------------------------------------------------------------
/sty/plistings.sty:
--------------------------------------------------------------------------------
  1 | %
  2 | % plistings.sty
  3 | %
  4 | % lltjp-listings.sty ベース，コード未整理
  5 | 
  6 | \NeedsTeXFormat{LaTeX2e}
  7 | \ProvidesPackage{plistings}[2015/12/07 v0.10 Japanese support of listings package]
  8 | 
  9 | %%%%%%%% Package options
 10 | \DeclareOption*{\PassOptionsToPackage{\CurrentOption}{listings}}
 11 | \ProcessOptions\relax
 12 | \RequirePackage{listings,etoolbox}
 13 | 
 14 | %%%%%%%% Japanese support
 15 | %% whether letter-space in a fixed mode box is doubled or not
 16 | \newif\if@ltj@lst@double
 17 | \lst@Key{doubleletterspace}f[t]{\lstKV@SetIf{#1}\if@ltj@lst@double}
 18 | 
 19 | % override \lst@FillFixed@
 20 | \def\lst@FillFixed@#1{%
 21 |   \ifx\@empty#1\else\ltj@lst@hss#1\expandafter\lst@FillFixed@\fi}
 22 | \def\ltj@lst@hss@double{\lst@hss\lst@hss}
 23 | 
 24 | % 最下層の処理
 25 | \newif\if@ltj@lst@kanji
 26 | \lst@AddToHook{InitVars}{\@ltj@lst@kanjifalse}
 27 | 
 28 | \def\lst@AppendLetter{%
 29 |     \ltj@lst@setletterflag\lst@Append}
 30 | \def\lst@AppendOther{%
 31 |     \lst@ifletter\lst@Output\lst@letterfalse\fi\@ltj@lst@kanjifalse
 32 |     \futurelet\lst@lastother\lst@Append}
 33 | 
 34 | \def\ltj@lst@setletterflag{%
 35 |   \lst@ifletter
 36 |     \if@ltj@lst@kanji\lst@Output\@ltj@lst@kanjifalse\fi
 37 |   \else
 38 |     \lst@lettertrue\if@ltj@lst@kanji\@ltj@lst@kanjifalse\else\lst@OutputOther\fi
 39 |   \fi}
 40 | 
 41 | \def\ltj@lst@setkanjiflag{%
 42 |   \lst@ifletter
 43 |     \lst@Output
 44 |   \else
 45 |     \if@ltj@lst@kanji\else\lst@OutputOther\fi\lst@lettertrue
 46 |   \fi\@ltj@lst@kanjitrue}
 47 | 
 48 | \def\ltj@lst@setopenflag{%
 49 |   \lst@ifletter
 50 |     \lst@letterfalse\lst@Output
 51 |   \else
 52 |     \if@ltj@lst@kanji\else\lst@OutputOther\fi
 53 |   \fi\@ltj@lst@kanjitrue}
 54 | 
 55 | \def\ltj@lst@setcloseflag{%
 56 |   \lst@ifletter\else\lst@lettertrue\fi\@ltj@lst@kanjitrue}
 57 | 
 58 | %%%% 和文文字の出力命令．
 59 | %%%% 和文文字の前にこれが前置されることになる．
 60 | \def\ltj@lst@ProcessJALetter#1{%
 61 |   \lst@whitespacefalse
 62 |   \ifnum`#1>255
 63 |     \ifnum\postbreakpenalty`#1>0
 64 |       \ltj@lst@setopenflag    % 開き括弧類
 65 |     \else
 66 |       \ifnum\prebreakpenalty`#1>0
 67 |         \ltj@lst@setcloseflag % 閉じ括弧類，句読点
 68 |       \else
 69 |         \ltj@lst@setkanjiflag % 通常の和文文字
 70 |     \fi\fi
 71 |     \advance\lst@length\@ne   % 和文文字は通常の2倍の幅
 72 |   \else
 73 |     \ltj@lst@setletterflag
 74 |   \fi
 75 |   \lst@Append#1}
 76 | 
 77 | 
 78 | %%%% \lst@InsideConvert の処理内容変更
 79 | %%%% active 文字化に加え，^^@ を和文文字の前に前置
 80 | \def\ltj@lst@MakeActive#1{%
 81 |     \let\lst@temp\@empty \ltj@lst@MakeActive@#1\relax}
 82 | \begingroup
 83 | \catcode`\^^A=\active
 84 | \catcode`\^^@=\active
 85 | \lowercase{%
 86 | \gdef\ltj@lst@MakeActive@#1{\let\lst@next\relax%
 87 |     \ifx#1\relax
 88 |     \else\let\lst@next\ltj@lst@MakeActive@
 89 |     \ifnum`#1>255
 90 |       \lst@lAddTo\lst@temp{^^@#1}%
 91 |     \else
 92 |       \lccode`\^^A=`#1 
 93 |       \lowercase{\lst@lAddTo\lst@temp{^^A}}%
 94 |     \fi\fi\lst@next}}
 95 | \endgroup
 96 | \begingroup \lccode`\~=`\ \relax \lowercase{%
 97 | \gdef\lst@InsideConvert@#1 #2{%
 98 |     \ltj@lst@MakeActive{#1}%
 99 |     \ifx\@empty#2%
100 |         \lst@lExtend\lst@arg{\lst@temp}%
101 |     \else
102 |         \lst@lExtend\lst@arg{\lst@temp~}%
103 |         \expandafter\lst@InsideConvert@
104 |     \fi #2}
105 | }\endgroup
106 | 
107 | 
108 | %%%%%%%% \lstinline の再定義．
109 | %%%% 引数を全部読み込み，\lst@InsideConvert で変換
110 | \renewcommand\lstinline[1][]{%
111 |     \leavevmode\bgroup % \hbox\bgroup --> \bgroup
112 |       \def\lst@boxpos{b}%
113 |       \lsthk@PreSet\lstset{flexiblecolumns,#1}%
114 |       \lsthk@TextStyle
115 |       \@ifnextchar\bgroup \ltj@lst@InlineG \ltj@lstinline@}
116 | \def\ltj@lstinline@#1{%
117 |   \edef\ltj@lst@temp{\the\catcode`#1}\lst@Init\relax\catcode`#1\ltj@lst@temp
118 |   \lst@Def{13}{\lst@DeInit\egroup \global\let\lst@inlinechars\@empty
119 |      \PackageError{Listings}{lstinline ended by EOL}\@ehc}%
120 |   \lst@InlineJ#1}
121 | \def\ltj@lst@InlineG{%
122 |   \lst@Init\relax\edef\ltj@lst@temp{\the\catcode`\}}%
123 |   \catcode`\}=2 \catcode`\ =12\relax
124 |   \lst@Def{13}{\lst@DeInit\egroup \global\let\lst@inlinechars\@empty
125 |      \PackageError{Listings}{lstinline ended by EOL}\@ehc}%
126 |   \let\lst@arg\@empty\afterassignment\ltj@lst@InlineG@@\@temptokena}
127 | \def\ltj@lst@InlineG@@{%
128 |   \catcode`\}=\ltj@lst@temp
129 |   \expandafter\expandafter\expandafter\lst@InsideConvert%
130 |   \expandafter{\the\@temptokena}\lst@arg\lst@DeInit\egroup}
131 | 
132 | %%%%%%%% \lstenv@process の再定義
133 | %%%% 基本的にはインライン時と同様に全トークンを読み込み→\lst@InsideConvert で変換
134 | %%%% その後，変換した中身は \scantokens で読み込み直される
135 | \begingroup \lccode`\~=`\^^M\lowercase{%
136 | \gdef\lstenv@Process#1{%
137 |     \ifx~#1%
138 |         \lstenv@DroppedWarning \let\lst@next\ltj@lstenv@ProcessM
139 |     \else\ifx^^J#1%
140 |         \lstenv@DroppedWarning \let\lst@next\lstenv@ProcessJ
141 |     \else
142 |         \let\lst@dropped#1\let\lst@next\lstenv@Process
143 |     \fi \fi
144 |     \lst@next}
145 | }\endgroup
146 | \begingroup\lccode`\[=`\{\lccode`\]=`\}\lccode`|=`\\\lowercase{%
147 | \gdef\ltj@lstenv@ProcessM{%
148 |     \let\lst@arg\@empty
149 |     \edef\lst@temp{|end[\lstenv@name]}%
150 |     \expandafter\expandafter\expandafter\lst@InsideConvert%
151 |         \expandafter{\lst@temp}%
152 |     \@temptokena{%
153 |         \expandafter\expandafter\expandafter\expandafter\expandafter\expandafter\expandafter
154 |         \lst@SkipToFirst\expandafter\expandafter\expandafter\scantokens\expandafter{\lst@arg}%
155 |     }
156 |     \expandafter\expandafter\expandafter\toks@\expandafter{\lst@arg}
157 |     \expandafter\edef\expandafter\lst@temp\expandafter##\expandafter1\lst@arg
158 |     {%
159 |         \noexpand\let\noexpand\lst@arg\noexpand\@empty%
160 |         \noexpand\lst@InsideConvert{\noexpand##1}
161 |         \the\@temptokena\the\toks@
162 |     }%
163 |     \lst@temp}
164 | }\endgroup
165 | 
166 | \def\lst@BeginDropInput#1{%
167 |     \lst@EnterMode{#1}%
168 |     {\lst@modetrue
169 |      \let\lst@OutputBox\@gobble
170 |      \let\lst@ifdropinput\iftrue
171 |      \let\lst@ProcessLetter\@gobble
172 |      \let\lst@ProcessDigit\@gobble
173 |      \let\lst@ProcessOther\@gobble
174 |      \let\lst@ProcessSpace\@empty
175 |      \let\lst@ProcessTabulator\@empty
176 |      \let\lst@ProcessFormFeed\@empty
177 |      \let\ltj@lst@ProcessJALetter\@gobble     % added
178 | }}
179 | 
180 | 
181 | %%%% ^^@ を active 文字化 (\ltj@lst@ProcessJALetter)
182 | \begingroup\catcode`\^^@=\active
183 | \lst@AddTo\lst@SelectStdCharTable{\def^^@{\ltj@lst@ProcessJALetter}}
184 | \endgroup
185 | \lst@AddToHook{InitVars}{%
186 |   \catcode`\^^@=\active
187 |   \if@ltj@lst@double
188 |     \let\ltj@lst@hss=\ltj@lst@hss@double
189 |   \else
190 |     \let\ltj@lst@hss=\lst@hss
191 |   \fi
192 | }
193 | 
194 | %%%% 白線対策のため，\lineskiplimit を負の値にする
195 | \newif\ifltj@lst@frame@top
196 | \newdimen\ltj@lst@frame@lslimit
197 | \gdef\lst@frameInit{%
198 |     \ltj@lst@frame@toptrue
199 |     \ifx\lst@framelshape\@empty \let\lst@frameL\@empty \fi
200 |     \ifx\lst@framershape\@empty \let\lst@frameR\@empty \fi
201 |     \def\lst@framevrule{\vrule\@width\lst@framerulewidth\relax}%
202 |     \lst@ifframeround
203 |         \lst@frameCalcDimA\z@ \@getcirc\@tempdima
204 |         \@tempdimb\@tempdima \divide\@tempdimb\tw@
205 |         \advance\@tempdimb -\@wholewidth
206 |         \edef\lst@frametextsep{\the\@tempdimb}%
207 |         \edef\lst@framerulewidth{\the\@wholewidth}%
208 |         \lst@frameCalcDimA\@ne \@getcirc\@tempdima
209 |         \@tempdimb\@tempdima \divide\@tempdimb\tw@
210 |         \advance\@tempdimb -\tw@\@wholewidth
211 |         \advance\@tempdimb -\lst@frametextsep
212 |         \edef\lst@rulesep{\the\@tempdimb}%
213 |     \fi
214 |     \lst@frameMakeBoxV\lst@framebox{\ht\strutbox}{\dp\strutbox}%
215 |     %%%%  ここから
216 |     \@tempdima\z@
217 |     \ifdim\ht\strutbox<\cht\@tempdima=\dimexpr\cht-\ht\strutbox\relax\fi
218 |     \ifdim\dp\strutbox<\cdp\advance\@tempdima=\dimexpr\cdp-\dp\strutbox\relax\fi
219 |     \ltj@lst@frame@lslimit=-\@tempdima
220 |     \def\lst@framelr{%
221 |       \ifltj@lst@frame@top\ltj@lst@frame@topfalse\else\lineskiplimit\ltj@lst@frame@lslimit\fi
222 |       \copy\lst@framebox}%
223 |     %%%% ここまで
224 |     \ifx\lst@frametshape\@empty\else
225 |         \lst@frameH T\lst@frametshape
226 |         \ifvoid\z@\else
227 |             \par\lst@parshape
228 |             \@tempdima-\baselineskip \advance\@tempdima\ht\z@
229 |             \ifdim\prevdepth<\@cclvi\p@\else
230 |                 \advance\@tempdima\prevdepth
231 |             \fi
232 |             \ifdim\@tempdima<\z@
233 |                 \vskip\@tempdima\vskip\lineskip
234 |             \fi
235 |             \noindent\box\z@\par
236 |             \lineskiplimit\maxdimen \lineskip\z@
237 |         \fi
238 |         \lst@frameSpreadV\lst@framextopmargin
239 |     \fi}
240 | 
241 | % lstinputlisting
242 | % modified from jlisting.sty
243 | \def\lst@InputListing#1{%
244 |    \begingroup
245 |       \lsthk@PreSet \gdef\lst@intname{#1}%
246 |       \expandafter\lstset\expandafter{\lst@set}%
247 |       \lsthk@DisplayStyle
248 |       \catcode\active=\active
249 |       \lst@Init\relax \let\lst@gobble\z@
250 |       \lst@SkipToFirst
251 |       \lst@ifprint \def\lst@next{\lst@get@filecontents{#1}}%
252 |       \else        \let\lst@next\@empty
253 |       \fi
254 |       \lst@next
255 |       \lst@DeInit
256 |    \endgroup}
257 | \newread\lst@inputfile
258 | \def\lst@get@filecontents#1{%
259 |    \let\lst@filecontents\@empty
260 |    \openin\lst@inputfile=#1\relax
261 |    \let\@lst@get@filecontents@prevline\relax
262 |    \lst@get@filecontents@loop
263 |    \closein\lst@inputfile
264 |    \lst@filecontents\empty}
265 | \def\lst@get@filecontents@loop{%
266 |    \read\lst@inputfile to\lst@temp
267 |    \let\lst@arg\@empty\expandafter\expandafter\expandafter\lst@InsideConvert\expandafter{\lst@temp}%
268 |    \ifx\@lst@get@filecontents@prevline\relax\else
269 |       \expandafter\expandafter\expandafter\def
270 |       \expandafter\expandafter\expandafter\lst@filecontents
271 |       \expandafter\expandafter\expandafter{%
272 |          \expandafter\lst@filecontents\@lst@get@filecontents@prevline}%
273 |    \fi
274 |    \let\@lst@get@filecontents@prevline\lst@arg
275 |    \ifeof\lst@inputfile\else
276 |       \expandafter\lst@get@filecontents@loop
277 |    \fi}
278 | 
279 | %%%%%%%% escape to \LaTeX
280 | %%%% 一旦中身を全部取得した後で，^^@ ( = \ltj@lst@ProcessJALetter) を
281 | %%%% トークン列から削除，その後 \scantokens で再読み込み
282 | \lstloadaspects{escape}
283 | \gdef\lst@Escape#1#2#3#4{%
284 |     \lst@CArgX #1\relax\lst@CDefX
285 |         {}%
286 |         {\lst@ifdropinput\else
287 |          \lst@TrackNewLines\lst@OutputLostSpace \lst@XPrintToken
288 |          \lst@InterruptModes
289 |          \lst@EnterMode{\lst@TeXmode}{\lst@modetrue}%
290 |          \ifx\^^M#2%
291 |              \lst@CArg #2\relax\lst@ActiveCDefX
292 |                  {}%
293 |                  {\lst@escapeend #4\lst@LeaveAllModes\lst@ReenterModes}%
294 |                  {\ltj@lst@MProcessListing}%
295 |          \else
296 |              \lst@CArg #2\relax\lst@ActiveCDefX
297 |                  {}%
298 |                  {\lst@escapeend #4\lst@LeaveAllModes\lst@ReenterModes
299 |                   \lst@newlines\z@ \lst@whitespacefalse}%
300 |                  {}%
301 |          \fi%
302 |          \ltj@lst@escape@setup#2
303 |          #3\lst@escapebegin\expandafter\lst@next%
304 |          \fi}%
305 | 	 {}}
306 | \def\ltj@lst@escape@setup#1{%
307 |   \begingroup\lccode`\~=`#1\lowercase{%
308 |   \gdef\lst@next##1~{%
309 |      \let\lst@arg\@empty\ltj@lst@remove@jacmd{##1}%
310 |      \expandafter\expandafter\expandafter\scantokens\expandafter{\lst@arg}%
311 |      ~}%
312 |   }\endgroup
313 | }
314 | 
315 | \begingroup
316 |   \catcode`\^^@=12 %
317 |   \gdef\ltj@lst@remove@jacmd#1{%
318 |     \expandafter\ltj@lst@remove@jacmd@\detokenize{#1}^^@\@nil^^@}
319 |   \gdef\ltj@lst@remove@jacmd@#1^^@{%
320 |     \ifx#1\@nil\else
321 |        \lst@lAddTo\lst@arg{#1}%
322 |        \expandafter\ltj@lst@remove@jacmd@
323 |     \fi}
324 | \endgroup
325 | 
326 | \endinput
327 | 


--------------------------------------------------------------------------------
/sty/review-custom.sty:
--------------------------------------------------------------------------------
1 | % for user-defined macro
2 | 


--------------------------------------------------------------------------------
/sty/review-style.sty:
--------------------------------------------------------------------------------
 1 | \NeedsTeXFormat{LaTeX2e}
 2 | \ProvidesPackage{review-style}[2021/01/06]
 3 | 
 4 | \RequirePackage{fancyhdr}
 5 | \pagestyle{fancy}
 6 | \lhead{\gtfamily\sffamily\bfseries\upshape \leftmark}
 7 | \chead{}
 8 | \rhead{\gtfamily\sffamily\bfseries\upshape \rightmark}
 9 | \fancyfoot{} % clear all header and footer fields
10 | \fancyfoot[LE,RO]{\thepage}
11 | \renewcommand{\sectionmark}[1]{\markright{\thesection~#1}{}}
12 | \renewcommand{\chaptermark}[1]{\markboth{\prechaptername\ \thechapter\ \postchaptername~#1}{}}
13 | \renewcommand{\headfont}{\gtfamily\sffamily\bfseries}
14 | 
15 | \fancypagestyle{plainhead}{%
16 | \fancyhead{}
17 | \fancyfoot{} % clear all header and footer fields
18 | \fancyfoot[LE,RO]{\thepage}
19 | \renewcommand{\headrulewidth}{0pt}
20 | \renewcommand{\footrulewidth}{0pt}}
21 | 
22 | %% using Helvetica as sans-serif
23 | \renewcommand{\sfdefault}{phv}
24 | 
25 | %% for listings
26 | %\renewcommand{\lstlistingname}{List}
27 | %\lstset{%
28 | %  breaklines=true,%
29 | %  breakautoindent=false,%
30 | %  breakindent=0pt,%
31 | %  fontadjust=true,%
32 | %  backgroundcolor=\color{shadecolor},%
33 | %  frame=single,%
34 | %  framerule=0pt,%
35 | %  basicstyle=\ttfamily\scriptsize,%
36 | %  commentstyle=\color{reviewgreen},%
37 | %  identifierstyle=\color{reviewblue},%
38 | %  stringstyle=\color{reviewred},%
39 | %  keywordstyle=\bfseries\color{reviewdarkred},%
40 | %}
41 | 
42 | %% disable hyperlink color and border
43 | \hypersetup{hidelinks}
44 | 
45 | \floatplacement{figure}{H}
46 | \floatplacement{table}{H}
47 | 
48 | % space between English/Japanese characters in list environments (\z@ means 0, no space. You can comment out below line for backward compatibility.)
49 | \def\reviewlistxkanjiskip{\z@}
50 | 
51 | % boxsetting
52 | \ifdefined\reviewboxsetting
53 |   \reviewboxsetting
54 | \fi
55 | 


--------------------------------------------------------------------------------
/sty/review-tcbox.sty:
--------------------------------------------------------------------------------
  1 | \NeedsTeXFormat{LaTeX2e}
  2 | \ProvidesPackage{review-tcbox}[2021/1/28, Version 0.1.0]
  3 | \RequirePackage{tikz,tcolorbox,varwidth,multicol,ifthen,ifptex,ifluatex,ifuptex,ifxetex}
  4 | 
  5 | \usetikzlibrary{calc}
  6 | \tcbuselibrary{xparse,hooks,skins,breakable}
  7 | 
  8 | \ifthenelse{\boolean{luatex}}{% LuaLaTeX
  9 |               \RequirePackage{luatexja}
 10 |               \def\reviewtcb@textgt#1{\textgt{#1}}
 11 |               \def\reviewtcb@gtfamily{\gtfamily}
 12 |               \def\reviewtcb@zw#1#2{#1\zw}
 13 |        }{
 14 |               \ifthenelse{\boolean{xetex}}{% XeLaTeX
 15 |                      \RequirePackage{zxjatype}
 16 |                      \def\reviewtcb@textgt#1{\textbf{#1}}
 17 |                      \def\reviewtcb@gtfamily{\bfseries}
 18 |                      \def\reviewtcb@zw#1#2{#2}
 19 |               }{
 20 |                      \ifthenelse{\boolean{ptex}}{% pLaTeX
 21 |                             \def\reviewtcb@textgt#1{\textgt{#1}}
 22 |                             \def\reviewtcb@gtfamily{\gtfamily}
 23 |                             \def\reviewtcb@zw#1#2{#1zw}
 24 |                      }{
 25 |                             \ifthenelse{\boolean{uptex}}{% upLaTeX
 26 |                                    \def\reviewtcb@textgt#1{\textgt{#1}}
 27 |                                    \def\reviewtcb@gtfamily{\gtfamily}
 28 |                                    \def\reviewtcb@zw#1#2{#1zw}
 29 |                             }{% pdfLaTeX
 30 |                                    \RequirePackage[whole]{bxcjkjatype}
 31 |                                    \def\reviewtcb@textgt#1{\textbf{#1}}
 32 |                                    \def\reviewtcb@gtfamily{\gtfamily}
 33 |                                    \def\reviewtcb@zw#1#2{#2}
 34 |                             }
 35 |                  }
 36 |               }
 37 | }
 38 | 
 39 | % markerスタイルのデフォルト設定
 40 | \def\tcb@rv@marker@markcolback{gray!80}
 41 | \def\tcb@rv@marker@markcoltext{white}
 42 | \def\tcb@rv@marker@markchar{!}
 43 | 
 44 | % 古いtcolorboxだとcolframe、colbackがない
 45 | \tcbset{%
 46 |   colframe/.code={\colorlet{tcbcolframe}{#1}\colorlet{tcbcol@frame}{#1}},
 47 |   colback/.code={\colorlet{tcbcolback}{#1}\colorlet{tcbcol@back}{#1}},
 48 |   rv marker markcolback/.store in=\tcb@rv@marker@markcolback,
 49 |   rv marker markcoltext/.store in=\tcb@rv@marker@markcoltext,
 50 |   rv marker markchar/.store in=\tcb@rv@marker@markchar,
 51 | }
 52 | 
 53 | % squarebox
 54 | %  - ごくシンプルな矩形
 55 | \DeclareTColorBox{rv@squarebox@nocaption}{ O{} }{%
 56 |   empty, % スキン
 57 |   left=3mm,right=3mm,top=3mm,bottom=3mm, % 内部パディング。デフォルトは4mm
 58 |   arc=0mm, % コーナーの半径。デフォルトは1mm
 59 |   % カラーは 色A!色Aの含み具合!色B。色Bを省略したときにはwhite
 60 |   colback=white, %white, % 背景。デフォルトはblack!5!white
 61 |   breakable, % ページ分断の許容
 62 |   enhanced jigsaw, % 分断時に上下罫線を切り取り
 63 |   pad at break=0mm, % 分断されたときの上下アキ。デフォルトは3.5mm
 64 |   boxrule=.25mm, % 線幅。toprule,bottomrule,leftrule,rightruleで個別指定も可
 65 |   before upper={\parindent\reviewtcb@zw{1}}, % 内容の1行目を字下げ
 66 |   #1} % オプション値で追加・上書き可能
 67 | 
 68 | \DeclareTColorBox{rv@squarebox@caption}{ m O{} }{%
 69 |   empty,
 70 |   left=3mm,right=3mm,top=3mm,bottom=3mm,
 71 |   arc=0mm,
 72 |   colback=white,
 73 |   breakable,
 74 |   enhanced jigsaw,
 75 |   pad at break=0mm,
 76 |   boxrule=.25mm,
 77 |   before upper={\parindent\reviewtcb@zw{1}},
 78 |   coltitle=black, % キャプション文字色
 79 |   colbacktitle=white, % キャプション背景
 80 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
 81 |   title={#1},
 82 |   #2}
 83 | 
 84 | % squaresepcaptionbox
 85 | %  - ごくシンプルな矩形・キャプション位置は分離
 86 | %  - キャプション位置をオプションで指定する (キャプションなしの場合は意味がない)。
 87 | %    attach boxed title to top left など
 88 | \DeclareTColorBox{rv@squaresepcaptionbox@nocaption}{ O{} }{%
 89 |   empty,
 90 |   left=3mm,right=3mm,top=3mm,bottom=3mm,
 91 |   arc=0mm,
 92 |   colback=white,
 93 |   breakable,
 94 |   enhanced jigsaw,
 95 |   pad at break=0mm,
 96 |   boxrule=.25mm,
 97 |   before upper={\parindent\reviewtcb@zw{1}},
 98 |   #1}
 99 | 
100 | \DeclareTColorBox{rv@squaresepcaptionbox@caption}{ m O{} }{%
101 |   empty,
102 |   left=3mm,right=3mm,top=3mm,bottom=3mm,
103 |   arc=0mm,
104 |   colback=white,
105 |   breakable,
106 |   enhanced jigsaw,
107 |   pad at break=0mm,
108 |   boxrule=.25mm,
109 |   before upper={\parindent\reviewtcb@zw{1}},
110 |   boxed title style={arc=0mm,boxrule=0mm},
111 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
112 |   colbacktitle=black,
113 |   title={#1},
114 |   attach boxed title to top left,% パラメータでtoの値を指定できないかとやってみたのだが無理そう。attach boxed title自体のパラメータもなし。
115 |   #2}
116 | 
117 | % folderbox
118 | %  - tcolorboxサンプルの改変。キャプションなしの場合は単なる角丸囲み
119 | \DeclareTColorBox{rv@folderbox@nocaption}{ O{} }{%
120 |   enhanced jigsaw,breakable,
121 |   pad at break=2mm,
122 |   arc=1mm,
123 |   boxrule=.25mm,
124 |   before upper={\parindent\reviewtcb@zw{1}},
125 |   colback=black!5!white,
126 |   coltitle=black,
127 |   #1}
128 | 
129 | \DeclareTColorBox{rv@folderbox@caption}{ m O{} }{%
130 |   enhanced jigsaw,breakable,
131 |   pad at break=2mm,
132 |   arc=1mm,
133 |   boxrule=.25mm,
134 |   before upper={\parindent\reviewtcb@zw{1}},
135 |   colback=black!5!white,
136 |   coltitle=black,
137 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
138 |   attach boxed title to top left={xshift=3.2mm,yshift=-0.25mm},
139 |   boxed title style={skin=enhancedfirst jigsaw, % キャプション部の飾り付け
140 |     size=small,arc=1mm,bottom=-1mm,
141 |     interior style={fill=none, top color=black!30!white, bottom color=black!5!white}}, % キャプション部網掛け
142 |   title={#1}
143 |   #2}
144 | 
145 | % clipbox
146 | %  - tcolorboxサンプルの改変。キャプションなしの場合は単なる角丸囲み
147 | \DeclareTColorBox{rv@clipbox@nocaption}{ O{} }{%
148 |   enhanced jigsaw,breakable,
149 |   pad at break=2mm,
150 |   before skip=2mm,after skip=2mm,
151 |   colback=black!5,colframe=black!50,boxrule=0.2mm,
152 |   before upper={\parindent\reviewtcb@zw{1}},
153 | #1}
154 | 
155 | \DeclareTColorBox{rv@clipbox@caption}{ m O{} }{%
156 |   enhanced jigsaw,breakable,
157 |   pad at break=2mm,
158 |   before skip=2mm,after skip=2mm,
159 |   colback=black!5,colframe=black!50,boxrule=0.2mm,
160 |   before upper={\parindent\reviewtcb@zw{1}},
161 |   attach boxed title to top left={xshift=6mm,yshift*=1mm-\tcboxedtitleheight},
162 |   varwidth boxed title*=-3cm,
163 |   boxed title style={
164 |     frame code={
165 |       \path[fill=tcbcol@back!30!black]
166 |       ([yshift=-1mm,xshift=-1mm]frame.north west)
167 |       arc[start angle=0,end angle=180,radius=1mm]
168 |       ([yshift=-1mm,xshift=1mm]frame.north east)
169 |       arc[start angle=180,end angle=0,radius=1mm];
170 |       \path[left color=tcbcol@back!60!black,right color=tcbcol@back!60!black,
171 |       middle color=tcbcol@back!80!black]
172 |       ([xshift=-2mm]frame.north west) -- ([xshift=2mm]frame.north east)
173 |       [rounded corners=1mm]-- ([xshift=1mm,yshift=-1mm]frame.north east)
174 |       -- (frame.south east) -- (frame.south west)
175 |       -- ([xshift=-1mm,yshift=-1mm]frame.north west)
176 |       [sharp corners]-- cycle;
177 |     },interior engine=empty,
178 |   },
179 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
180 |   title={#1},
181 | #2}
182 | 
183 | % dottedbox
184 | %  - ドット囲み。キャプションは内容に接続させている
185 | \DeclareTColorBox{rv@dottedbox@nocaption}{ O{} }{%
186 |   enhanced,breakable,arc=1mm,
187 |   frame hidden,colback=white,
188 |   borderline={0.25mm}{0mm}{black,dotted},
189 |   fontupper={\gtfamily\sffamily},
190 |   % before upper={\parindent\reviewtcb@zw{1}},
191 |   #1}
192 | 
193 | \DeclareTColorBox{rv@dottedbox@caption}{ m O{} }{%
194 |   enhanced,breakable,arc=1mm,
195 |   frame hidden,colback=white,
196 |   borderline={0.25mm}{0mm}{black,dotted},
197 |   fontupper={\gtfamily\sffamily},
198 |   % before upper={\parindent\reviewtcb@zw{1}},
199 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
200 |   coltitle=black,
201 |   attach title to upper, after title={\quad},
202 |   title={#1},
203 |   #2}
204 | 
205 | % bothsidelinebox
206 | %  - 左右線
207 | \DeclareTColorBox{rv@bothsidelinebox@nocaption}{ O{} }{%
208 |   enhanced,breakable,skin=enhancedmiddle,
209 |   frame hidden,interior hidden,top=0mm,bottom=0mm,boxsep=0mm,
210 |   borderline={0.4mm}{0mm}{black},
211 |   borderline={0.4mm}{0.4mm}{black!50},
212 |   borderline={0.4mm}{0.8mm}{black!10},
213 |   before upper={\parindent\reviewtcb@zw{1}},
214 |   #1}
215 | 
216 | \DeclareTColorBox{rv@bothsidelinebox@caption}{ m O{} }{%
217 |   enhanced,breakable,skin=enhancedmiddle,
218 |   frame hidden,interior hidden,top=0mm,bottom=0mm,boxsep=0mm,
219 |   borderline={0.4mm}{0mm}{black},
220 |   borderline={0.4mm}{0.4mm}{black!50},
221 |   borderline={0.4mm}{0.8mm}{black!10},
222 |   before upper={\parindent\reviewtcb@zw{1}},
223 |   coltitle=black,
224 |   bottomtitle=2mm,
225 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
226 |   title={#1},
227 |   #2}
228 | 
229 | % leftsidelinebox
230 | %  - 左線
231 | \DeclareTColorBox{rv@leftsidelinebox@nocaption}{ O{} }{%
232 |   enhanced,breakable,skin=enhancedmiddle,
233 |   frame hidden,interior hidden,top=0mm,bottom=0mm,right=0mm,boxsep=0mm,
234 |   borderline west={0.4mm}{0mm}{black}, % westを付けて左のみにする
235 |   borderline west={0.4mm}{0.4mm}{black!50},
236 |   borderline west={0.4mm}{0.8mm}{black!10},
237 |   before upper={\parindent\reviewtcb@zw{1}},
238 |   #1}
239 | 
240 | \DeclareTColorBox{rv@leftsidelinebox@caption}{ m O{} }{%
241 |   enhanced,breakable,skin=enhancedmiddle,
242 |   frame hidden,interior hidden,top=0mm,bottom=0mm,right=0mm,boxsep=0mm,
243 |   borderline west={0.4mm}{0mm}{black},
244 |   borderline west={0.4mm}{0.4mm}{black!50},
245 |   borderline west={0.4mm}{0.8mm}{black!10},
246 |   before upper={\parindent\reviewtcb@zw{1}},
247 |   coltitle=black,
248 |   bottomtitle=2mm,
249 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
250 |   title={#1},
251 |   #2}
252 | 
253 | % outerarcbox
254 | %  - 内側にさらに角丸が入るデザイン
255 | \DeclareTColorBox{rv@outerarcbox@nocaption}{ O{} }{%
256 |   empty, % スキン
257 |   arc=3mm, % コーナーの半径
258 |   outer arc=1mm,
259 |   colback=white,
260 |   breakable,
261 |   enhanced jigsaw,
262 |   pad at break=0mm,
263 |   boxrule=.25mm,
264 |   before upper={\parindent\reviewtcb@zw{1}},
265 |   #1}
266 | 
267 | \DeclareTColorBox{rv@outerarcbox@caption}{ m O{} }{%
268 |   empty,
269 |   arc=3mm,
270 |   outer arc=1mm,
271 |   colback=white,
272 |   breakable,
273 |   enhanced jigsaw,
274 |   pad at break=0mm,
275 |   boxrule=.25mm,
276 |   before upper={\parindent\reviewtcb@zw{1}},
277 |   coltitle=black,
278 |   colbacktitle=white,
279 |   titlerule=0.25mm,
280 |   % titlerule style={}, % ダッシュかドットにしたいが変なことになる
281 |   fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
282 |   title={#1},
283 |   #2}
284 | 
285 | % marker
286 | %  - tcolorboxマニュアルのTipsを改変。白黒をデフォルトとし、分割に対応
287 | %  固有オプション:
288 | %  - rv marker markchar=文字: 左列に表示するマークの文字。デフォルト:!
289 | %  - rv marker markcolback=色: 左列の背景色。デフォルト:gray!80
290 | %  - rv marker markcoltext=色: 左列の文字色。デフォルト:white
291 | \DeclareTColorBox{rv@marker@nocaption}{ O{} }{%
292 |   enhanced,breakable,
293 |   before skip=2mm,after skip=3mm,
294 |   boxrule=0.4pt,left=5mm,right=2mm,top=1mm,bottom=1mm,
295 |   before upper={\parindent\reviewtcb@zw{1}},
296 |   colback=gray!5,
297 |   colframe=black,
298 |   sharp corners,rounded corners=southeast,arc is angular,arc=3mm,
299 |   underlay first={%
300 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
301 |     },
302 |   underlay middle={%
303 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
304 |     },
305 |   underlay last={%
306 |     \path[fill=tcbcolback!80!black] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
307 |     \path[draw=tcbcolframe,shorten <=-0.05mm,shorten >=-0.05mm] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
308 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
309 |     },
310 |   underlay unbroken={%
311 |     \path[fill=tcbcolback!80!black] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
312 |     \path[draw=tcbcolframe,shorten <=-0.05mm,shorten >=-0.05mm] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
313 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
314 |     },
315 |  drop fuzzy shadow,#1}
316 | 
317 | \DeclareTColorBox{rv@marker@caption}{ m O{} }{%
318 |   enhanced,breakable,
319 |   before skip=2mm,after skip=3mm,
320 |   boxrule=0.4pt,left=5mm,right=2mm,top=1mm,bottom=1mm,
321 |   colback=gray!5,
322 |   colframe=black,
323 |   sharp corners,rounded corners=southeast,arc is angular,arc=3mm,
324 |   underlay first={%
325 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
326 |     },
327 |   underlay middle={%
328 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
329 |     },
330 |   underlay last={%
331 |     \path[fill=tcbcolback!80!black] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
332 |     \path[draw=tcbcolframe,shorten <=-0.05mm,shorten >=-0.05mm] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
333 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
334 |     },
335 |   underlay unbroken={%
336 |     \path[fill=tcbcolback!80!black] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
337 |     \path[draw=tcbcolframe,shorten <=-0.05mm,shorten >=-0.05mm] ([yshift=3mm]interior.south east)--++(-0.4,-0.1)--++(0.1,-0.2);
338 |     \path[fill=\tcb@rv@marker@markcolback,draw=none] (interior.south west) rectangle node[\tcb@rv@marker@markcoltext]{\Huge\bfseries\tcb@rv@marker@markchar} ([xshift=4mm]interior.north west);
339 |     },
340 |  detach title,
341 |  title={#1},
342 |  coltitle=black,
343 |  fonttitle={\reviewtcb@gtfamily\sffamily\bfseries},
344 |  before upper={\tcbtitle\par\parindent\reviewtcb@zw{1}},
345 |  % before upper={\parindent\reviewtcb@zw{1}},
346 |  drop fuzzy shadow,#2}
347 | 
348 | \endinput
349 | 


--------------------------------------------------------------------------------
/sty/reviewmacro.sty:
--------------------------------------------------------------------------------
 1 | % Re:VIEW 2互換のlayout.tex.erb記載相当の内容
 2 | \RequirePackage{review-base}
 3 | 
 4 | % Re:VIEW 2互換のreviewmacro.sty(装飾カスタマイズ)内容
 5 | \RequirePackage{review-style}
 6 | 
 7 | % 囲み飾りの設定
 8 | \ifdefined\reviewboxsetting%
 9 |   \RequirePackage{review-tcbox}
10 | \fi
11 | 
12 | % ユーザー固有の定義
13 | \RequirePackage{review-custom}
14 | 
15 | %% run \@endofreviewmacrohook at the end of reviewmacro style
16 | \@ifundefined{@endofreviewmacrohook}{}{%
17 | \let\AtEndOfReVIEWMacro\@firstofone
18 | \@endofreviewmacrohook}
19 | 
20 | \endinput
21 | 


--------------------------------------------------------------------------------
/style.css:
--------------------------------------------------------------------------------
  1 | @charset "utf-8";
  2 | /* Tatujin-Publishing   */
  3 | /* Style sheet for epub */
  4 | /* Ver.0.8b1            */
  5 | 
  6 | /*
  7 | Scale & Rhythm
  8 | line-height 1.6
  9 | 16px = 1em
 10 | x:p:h1:h2:h3 = 12px:14px:16px:24px:30px
 11 | */
 12 | * {
 13 | }
 14 | body {
 15 |     margin: 0;
 16 |     padding: 0;
 17 |     font-size: 1em;
 18 |     line-height:1.6;
 19 |     font-family: "ShinGoPro-Regular","ShinGo-Regular", sans-serif;
 20 |     /*
 21 |     word-break: normal;
 22 |     -webkit-line-break: after-white-space;
 23 |     */
 24 | }
 25 | p, ul, ol, dl, pre, table {
 26 |     font-family: "ShinGo Regular","ShinGo R","新ゴR","新ゴ R", sans-serif;
 27 |     font-size: 0.875em;
 28 | }
 29 | /* Heading */
 30 | h1 {
 31 |     margin: 0 0 3em;
 32 |     padding: 0.5em 0 0;
 33 |     border-top: 14px #326450 solid;
 34 |     text-align: left;
 35 |     font-size: 1.875em;
 36 |     font-weight: bold;
 37 | }
 38 | h2 {
 39 |     margin: 3em 0 0.5em;
 40 |     padding: 0.5em 0 0;
 41 |     border-top: 2px #326450 solid;
 42 |     text-align: left;
 43 |     font-size: 1.5em;
 44 |     font-weight: bold;
 45 | }
 46 | h3 {
 47 |     margin: 3em 0 0.5em;
 48 |     padding: 0;
 49 |     text-align: left;
 50 |     font-size: 1em;
 51 |     font-weight: bold;
 52 | }
 53 | h4, h5, h6 {
 54 |     margin:0.7em 0;
 55 |     padding: 0;
 56 |     text-align: left;
 57 |     line-height: 1.6;
 58 |     font-weight: bold;
 59 | }
 60 | /* Paragraph */
 61 | p {
 62 |     margin:0.7em 0;
 63 |     padding: 0;
 64 |     text-align: left;
 65 |     text-indent: 1em;
 66 |     line-height: 1.6;
 67 | }
 68 | div.lead p {
 69 |     color: #666;
 70 |     line-height: 1.6;
 71 |     font-size: 0.75em;
 72 | }
 73 | /* List */
 74 | ul, ol {
 75 |     margin: 2em 0 2em 2em;
 76 |     padding: 0;
 77 |     list-style-position: outside;
 78 | }
 79 | ul > li,
 80 | ol > li {
 81 |     margin: 0 0 0.7em 0;
 82 |     padding: 0;
 83 |     line-height: 1.6;
 84 | }
 85 | dl {
 86 |     margin: 2em 0;
 87 |     padding: 0;
 88 | }
 89 | dt {
 90 |     margin: 0;
 91 |     padding: 0;
 92 |     font-weight: bold;
 93 | }
 94 | dd {
 95 |     margin: 0 0 1em 2em;
 96 |     padding: 0;
 97 |     line-height: 1.6;
 98 | }
 99 | /* Table
100 | p.tablecaptionではなく
101 | table caption {}を使う方が良いかも？
102 | */
103 | table {
104 |     margin: 0 auto 2em auto;
105 |     border-collapse: collapse;
106 | }
107 | table tr th {
108 |     background-color: #eee;
109 |     border:1px #aaa solid;
110 |     font-size: 0.75em;
111 |     font-weight: normal;
112 | }
113 | table tr td {
114 |     padding: 0.3em;
115 |     border:1px #aaa solid;
116 |     font-size: 0.75em;
117 | }
118 | p.tablecaption, table caption {
119 |     margin: 0;
120 |     color: #666;
121 |     font-size: 0.75em;
122 |     font-weight: bold;
123 |     text-indent: 0;
124 | }
125 | /* Quote */
126 | blockquote {
127 |     margin: 2em 0 2em 2em;
128 |     padding: 0.3em 1em;
129 |     border: 1px #aaa solid;
130 | }
131 | /* Column Block */
132 | div.column {
133 |     margin: 2em 0 2em 2em;
134 |     padding: 0.3em 1em;
135 |     background-color: #eee;
136 |     -webkit-border-radius: 0.7em;    
137 | }
138 | div.column *{
139 |     margin:0.7em 0;    
140 | }
141 | div.column ul,
142 | div.column ol {
143 |     list-style-position: inside;
144 | }
145 | /* Code Block */
146 | /*
147 | ※シンプルにできるかも
148 | div.code {}
149 | div.code pre.list,
150 | div.code pre.cmd {}
151 | div.code p.caption {}
152 | */
153 | div.code, div.caption-code, div.source-code, div.emlist-code, div.emlistnum-code {
154 |     margin: 1em 0 2em 2em;
155 |     padding: 0;
156 | }
157 | pre.emlist, pre.source, pre.list {
158 |     margin: 0;
159 |     padding: 5px;
160 |     border: 1px #aaa solid;
161 | }
162 | div p.caption {
163 |     margin: 0;
164 |     color: #666;
165 |     font-size: 0.75em;
166 |     font-weight: bold;
167 | }
168 | div.cmd-code pre.cmd {
169 |     margin: 0;
170 |     padding: 5px;
171 |     color: #ccc;
172 |     font-weight: bold;
173 |     background-color: #444;
174 |     -webkit-border-radius: 0.5em;
175 | }
176 | pre.cmd, pre.emlist, pre.list, pre.source {
177 |     white-space: pre-wrap;
178 | }
179 | 
180 | /* Image Block */  
181 | /* div.image p.caption {}
182 | ※captionをそろえた方が良いかも？*/
183 | div.image {
184 |     margin: 2em auto;
185 |     padding: 0;
186 | }
187 | div.image img {
188 |     margin: 0 auto;
189 |     padding: 0;
190 |     display: block;
191 | }
192 | div.image p.caption {
193 |     margin: 0 auto;
194 |     text-align: center;
195 |     color: #666;
196 |     font-size: 0.75em;
197 |     font-weight: bold;
198 |     text-indent: 0;
199 | }
200 | /* Footnote Block */
201 | /* p.footnoteはいらないかも？ */
202 | div.footnote {
203 | }
204 | div.footnote p.footnote {
205 | 	color: #666;
206 |     line-height: 1.6;
207 |     font-size: 0.75em;
208 |     text-indent: 0;
209 | }
210 | /* Colophon */
211 | div.colophon {
212 |     margin: 3em auto;
213 | }
214 | div.colophon p {
215 |     text-indent: 0;
216 | }
217 | div.colophon p.title {
218 |     font-size: 1.5em;
219 | }
220 | div.colophon table {
221 |     margin: 1em 0 2em;
222 |     border: none;
223 | }
224 | div.colophon table tr th {
225 |     background-color: #fff;
226 |     font-size: 1.2em;
227 |     font-weight: normal;
228 |     border: none;
229 | }
230 | div.colophon table tr td {
231 |     font-size: 1.2em;
232 |     font-weight: normal;
233 |     border: none;
234 | }
235 | 
236 | /* Inline */
237 | a[href],
238 | a:link,
239 | a:visited {
240 |     border-bottom: 1px dotted #531084;
241 |     text-decoration: none;
242 | }
243 | b {
244 |     font-weight: bold;
245 | }
246 | strong{
247 |     font-weight: bold;
248 | }
249 | em {
250 |     font-style: italic;
251 | }
252 | span.balloon {
253 |     font-size: 0.9em;
254 | }
255 | span.balloon:before {
256 |     content: "←";
257 | }
258 | 
259 | /**
260 |  * from Rouge
261 |  */
262 | .highlight table td { padding: 5px; }
263 | .highlight table pre { margin: 0; }
264 | .highlight .cm {
265 |   color: #999988;
266 |   font-style: italic;
267 | }
268 | .highlight .cp {
269 |   color: #999999;
270 |   font-weight: bold;
271 | }
272 | .highlight .c1 {
273 |   color: #999988;
274 |   font-style: italic;
275 | }
276 | .highlight .cs {
277 |   color: #999999;
278 |   font-weight: bold;
279 |   font-style: italic;
280 | }
281 | .highlight .c, .highlight .cd {
282 |   color: #999988;
283 |   font-style: italic;
284 | }
285 | .highlight .err {
286 |   color: #a61717;
287 |   background-color: #e3d2d2;
288 | }
289 | .highlight .gd {
290 |   color: #000000;
291 |   background-color: #ffdddd;
292 | }
293 | .highlight .ge {
294 |   color: #000000;
295 |   font-style: italic;
296 | }
297 | .highlight .gr {
298 |   color: #aa0000;
299 | }
300 | .highlight .gh {
301 |   color: #999999;
302 | }
303 | .highlight .gi {
304 |   color: #000000;
305 |   background-color: #ddffdd;
306 | }
307 | .highlight .go {
308 |   color: #888888;
309 | }
310 | .highlight .gp {
311 |   color: #555555;
312 | }
313 | .highlight .gs {
314 |   font-weight: bold;
315 | }
316 | .highlight .gu {
317 |   color: #aaaaaa;
318 | }
319 | .highlight .gt {
320 |   color: #aa0000;
321 | }
322 | .highlight .kc {
323 |   color: #000000;
324 |   font-weight: bold;
325 | }
326 | .highlight .kd {
327 |   color: #000000;
328 |   font-weight: bold;
329 | }
330 | .highlight .kn {
331 |   color: #000000;
332 |   font-weight: bold;
333 | }
334 | .highlight .kp {
335 |   color: #000000;
336 |   font-weight: bold;
337 | }
338 | .highlight .kr {
339 |   color: #000000;
340 |   font-weight: bold;
341 | }
342 | .highlight .kt {
343 |   color: #445588;
344 |   font-weight: bold;
345 | }
346 | .highlight .k, .highlight .kv {
347 |   color: #000000;
348 |   font-weight: bold;
349 | }
350 | .highlight .mf {
351 |   color: #009999;
352 | }
353 | .highlight .mh {
354 |   color: #009999;
355 | }
356 | .highlight .il {
357 |   color: #009999;
358 | }
359 | .highlight .mi {
360 |   color: #009999;
361 | }
362 | .highlight .mo {
363 |   color: #009999;
364 | }
365 | .highlight .m, .highlight .mb, .highlight .mx {
366 |   color: #009999;
367 | }
368 | .highlight .sb {
369 |   color: #d14;
370 | }
371 | .highlight .sc {
372 |   color: #d14;
373 | }
374 | .highlight .sd {
375 |   color: #d14;
376 | }
377 | .highlight .s2 {
378 |   color: #d14;
379 | }
380 | .highlight .se {
381 |   color: #d14;
382 | }
383 | .highlight .sh {
384 |   color: #d14;
385 | }
386 | .highlight .si {
387 |   color: #d14;
388 | }
389 | .highlight .sx {
390 |   color: #d14;
391 | }
392 | .highlight .sr {
393 |   color: #009926;
394 | }
395 | .highlight .s1 {
396 |   color: #d14;
397 | }
398 | .highlight .ss {
399 |   color: #990073;
400 | }
401 | .highlight .s {
402 |   color: #d14;
403 | }
404 | .highlight .na {
405 |   color: #008080;
406 | }
407 | .highlight .bp {
408 |   color: #999999;
409 | }
410 | .highlight .nb {
411 |   color: #0086B3;
412 | }
413 | .highlight .nc {
414 |   color: #445588;
415 |   font-weight: bold;
416 | }
417 | .highlight .no {
418 |   color: #008080;
419 | }
420 | .highlight .nd {
421 |   color: #3c5d5d;
422 |   font-weight: bold;
423 | }
424 | .highlight .ni {
425 |   color: #800080;
426 | }
427 | .highlight .ne {
428 |   color: #990000;
429 |   font-weight: bold;
430 | }
431 | .highlight .nf {
432 |   color: #990000;
433 |   font-weight: bold;
434 | }
435 | .highlight .nl {
436 |   color: #990000;
437 |   font-weight: bold;
438 | }
439 | .highlight .nn {
440 |   color: #555555;
441 | }
442 | .highlight .nt {
443 |   color: #000080;
444 | }
445 | .highlight .vc {
446 |   color: #008080;
447 | }
448 | .highlight .vg {
449 |   color: #008080;
450 | }
451 | .highlight .vi {
452 |   color: #008080;
453 | }
454 | .highlight .nv {
455 |   color: #008080;
456 | }
457 | .highlight .ow {
458 |   color: #000000;
459 |   font-weight: bold;
460 | }
461 | .highlight .o {
462 |   color: #000000;
463 |   font-weight: bold;
464 | }
465 | .highlight .w {
466 |   color: #bbbbbb;
467 | }
468 | .highlight {
469 |   background-color: #f8f8f8;
470 | }
471 | .rouge-table { border-spacing: 0 }
472 | .rouge-gutter { text-align: right }
473 | 
474 | /**
475 |  * from EBPAJ EPUB 3 File Creation Guide sample style
476 |  *
477 |  * cf. http://ebpaj.jp/counsel/guide
478 |  */
479 | 
480 | /* image width definition(pacentage)  */
481 | .width-010per { width:  10%; }
482 | .width-020per { width:  20%; }
483 | .width-025per { width:  25%; }
484 | .width-030per { width:  30%; }
485 | .width-033per { width:  33%; }
486 | .width-040per { width:  40%; }
487 | .width-050per { width:  50%; }
488 | .width-060per { width:  60%; }
489 | .width-067per { width:  67%; }
490 | .width-070per { width:  70%; }
491 | .width-075per { width:  75%; }
492 | .width-080per { width:  80%; }
493 | .width-090per { width:  90%; }
494 | .width-100per { width: 100%; }
495 | 


--------------------------------------------------------------------------------
/transaction.re:
--------------------------------------------------------------------------------
  1 | = トランザクション
  2 | 
  3 | 
  4 | 本章では、トランザクションというものをより具体的にイメージしてもらうことを目標に説明します。
  5 | 
  6 | 
  7 | == トランザクションが行う操作
  8 | 
  9 | DBMS におけるトランザクションが実際にデータベースに対して行う処理は、
 10 | トランザクションを実行して欲しい人の視点で見れば、
 11 | データの読み書き操作を複数回実行する、それだけです。
 12 | 
 13 | データを読む場合、クエリ (典型的には SQL の @<tt>{select} 文) を実行して、
 14 | その結果を得ます。@<tt>{select} 文は読んだデータを色々な手段で加工できますが、
 15 | データベースに対して行っていることは、データを読んでいるだけです。
 16 | SQL をサポートしない、より基本的な機能のみを持つ DBMS では、
 17 | ある Table において Key とその値を指定して絞り込んだ Record 集合を読むという操作が可能です。
 18 | このような基本的な DBMS は @<tt>{join} や @<tt>{group by} などの高度な演算はサポートしておらず、
 19 | 必要ならアプリケーション側でそれらの機能を実装する必要があるだろうということです。
 20 | 読むだけでは書けませんので、DBMS においては @<tt>{select} 文や
 21 | Key による絞り込みによって得た Record 集合に対して
 22 | 更新(@<tt>{update}) や削除(@<tt>{delete}) 操作が可能です。
 23 | また、挿入(@<tt>{insert}) 操作は、Record を生成し、Table に追加することができます。
 24 | 
 25 | SQL の世界では @<tt>{select, update, delete, insert} がデータベースを読み書きする基本的な操作群で、
 26 | これらをまとめて DML (Data Manipulation Language) と呼びます。
 27 | ここでは SQL を使わない世界にも配慮して @<tt>{select} の代わりに @<tt>{read} という言葉を使うことにしましょう。
 28 | また、@<tt>{update, delete, insert} はデータベースに変更を加えるという意味で @<tt>{write} と呼ぶことにします。
 29 | 
 30 | @<tt>{read, update, delete, insert} の 4 つの操作ができるのが汎用的な DBMS だとすると、
 31 | より低機能な DBMS は何を供えているべきでしょうか。
 32 | @<tt>{read} ができないと DBMS の意味がないでしょうね。
 33 | 実際、ほぼ Read-only の DBMS というのは存在します。Hadoop など主にデータ分析に特化したものです。
 34 | 実際はデータ投入や追記など制限的な @<tt>{write} 操作が可能ですが、
 35 | 例えば @<tt>{read} 操作と @<tt>{write} 操作は同時に実行されないことを前提として作られていたりします。
 36 | 私はこれをトランザクションシステムと呼ぶのには抵抗があります。
 37 | 何故なら本来トランザクションシステムが制御しなければならない難しさのほとんどを排除しているからです。
 38 | もちろん Read-only システムには目的に特化した特有の難しさはあります。
 39 | 例えば、Hadoop では、如何にタスクを分割して複数ノードおよびプロセッサに割り振るか、
 40 | どのアルゴリズムを使って集約処理するか、などは難しい問題だと思います。
 41 | ただ、これはトランザクションシステムを実現する難しさとは違う難しさですよという主張です。
 42 | @<tt>{read} に続いて次に、データ投入を実現したければ @<tt>{insert} が必要でしょう。
 43 | 初期データロードという特殊なタスクは必ずしもトランザクショナルに行わなくても良いのですが、
 44 | ここでは、@<tt>{insert} 操作で代用することにしましょう。
 45 | データが増える一方というのも困るでしょうから、次に @<tt>{delete} が欲しくなるでしょうか。
 46 | @<tt>{update} は @<tt>{delete} と @<tt>{insert} で代用できますので、単純に機能だけで見ると、
 47 | @<tt>{update} 操作は一番優先順位が低いといえるかも知れません。
 48 | 別の視点で見ると、初期データロードは別の手段で用意するとして、
 49 | データは増えもせず減りもしないというデータベースを考えることもできます。
 50 | その場合は、@<tt>{read} と @<tt>{update} だけあれば事は足ります。
 51 | このように、より制限的な操作しかトランザクションに許さない DBMS も
 52 | Read-only でなければトランザクション処理システムと言えるでしょう。
 53 | 
 54 | どの Record をどのように読んで、どんな計算をし、どのように書くかはトランザクションの内容次第です。
 55 | それをトランザクションロジックと呼びます。
 56 | トランザクションロジックはどう表現されているでしょうか？
 57 | 一般にトランザクションロジックは、
 58 | アプリケーション内に実装されたトランザクションを実行するプログラムコード断片や、
 59 | DBMS 内に保存されたストアドプロシージャなどに記録されています。
 60 | 
 61 | 
 62 | ====[column] DML の意味論
 63 | 
 64 | SQL は @<tt>{write} 操作として @<tt>{insert, delete, update} を用意しています。
 65 | これら全てについて、実行を成功させるためにはデータベース状態についての条件が存在しています。
 66 | その条件とは、@<tt>{insert} については 対象 Record が存在していないこと、
 67 | @<tt>{update,delete} については 対象 Record が存在していることです。
 68 | 条件を満たさない場合、操作は失敗し、トランザクションロジックは別の手を考えるか、
 69 | トランザクションを Abort するかの二択を迫られます。
 70 | 
 71 | 一般には、無条件で実行できる @<tt>{write} 操作も存在します。
 72 | たとえば、Key-value store では、@<tt>{put} という操作がありますが、
 73 | これは、対応する Record が存在したら SQL の @<tt>{update} として振舞い、
 74 | そうでなければ SQL の @<tt>{insert} として振舞う、という意味を持ちます。
 75 | @<tt>{put} のことを @<tt>{upsert} といったりもします。
 76 | これは任意のデータベース状態において成功します。
 77 | Delete についても同様の意味論の操作を構成することができます。
 78 | たとえば、@<tt>{delete_if_exists} という操作は、
 79 | 対応する Record が存在してるときのみ SQL の @<tt>{delete} として振る舞う、
 80 | といった具合です。
 81 | 
 82 | このような意味論は、データベースへの操作をどのような形で提供するかだけでなく、
 83 | トランザクション処理エンジンの設計実装にも関わってきますので注意が必要です。
 84 | 
 85 | ====[/column]
 86 | 
 87 | 
 88 | == トランザクション処理の流れ
 89 | 
 90 | トランザクションの実行は、ユーザやアプリケーション側からは、
 91 | @<tt>{begin} コマンドで始まり、先に説明したデータベースの読み書き操作を複数回行った後、
 92 | @<tt>{commit} または @<tt>{abort} コマンドの実行で終わります。
 93 | @<tt>{abort} コマンドは @<tt>{rollback} コマンドと呼ばれることもあります。
 94 | @<tt>{begin} や @<tt>{commit}、@<tt>{abort} は DML とは区別され、トランザクション制御文と呼ばれるようです。
 95 | トランザクションが開始されることが明らかであるときは @<tt>{begin} が省略できるインターフェースもあります。
 96 | @<tt>{commit} コマンドはトランザクションの正常終了を試みる操作です。成功した場合、
 97 | その結果すなわちトランザクションによる書き込み操作がデータベースに反映されます。
 98 | このときトランザクションは Commit したもしくは Committed 状態になった、といいます。
 99 | Committed 状態になったトランザクションの結果は失われません。これが ACID の D (Durability) の性質ですね。
100 | @<tt>{abort} コマンドは、トランザクションを意図的に失敗させる操作です。
101 | このとき、そのトランザクションの実行はなかったことになり、
102 | Abort したもしくは Aborted 状態になった、といいます。
103 | トランザクションが完了したら、必ず Committed もしくは Aborted いずれかの状態となります。
104 | これが ACID の A (Atomicity) の性質ですね。
105 | @<tt>{abort} コマンド以外の要因でもトランザクションは Abort することがあります。
106 | @<tt>{abort} コマンド要因の Abort を User abort、それ以外を System abort と呼びます。
107 | @<tt>{commit} コマンドは失敗する可能性があります。
108 | @<tt>{commit} 要求が来たけれども ACID の性質を担保できないと判断したとき、
109 | DBMS はそのトランザクションを System abort させ、@<tt>{commit} コマンドを失敗させます。
110 | 例えば、並行にトランザクションが実行されていて、
111 | 全てのトランザクションを同時に @<tt>{commit} 扱いすることができない場合は
112 | System abort となります@<fn>{footnote_user_abort_system_abort}。
113 | また、突然の電源断などの故障(以後 Crash と呼びます)が起き、@<tt>{commit} 成否の返事を受けとれなかったとき、
114 | @<tt>{commit} できたかどうかは、再起動時のデータベース復旧操作 (Crash recovery といいます) が終わるまで分かりません
115 | @<fn>{footnote_commit_confirm}。Crash によって Abort 扱いになる場合も System abort としてよいでしょう。
116 | 
117 | 
118 | //footnote[footnote_user_abort_system_abort][Unique key 制約違反などでもトランザクションは Abort しますが、対応する操作についてその場でエラーが返ってきて User abort の判断を迫られるか、Commit 要求後に制約違反が判明して System abort となるかは、DBMS の設計によります。]
119 | //footnote[footnote_commit_confirm][分散 DBMS においては故障の概念が違うのでその限りではありません。]
120 | 
121 | 
122 | 
123 | 
124 | 
125 | == トランザクションが満たすべき性質
126 | 
127 | 
128 | 理想的には、@<tt>{commit} に成功したトランザクション全てが ACID の性質を満たすように、
129 | そして、出来るだけ @<tt>{commit} を成功させるように、DBMS は頑張る必要があります。
130 | これを読んでいる皆さんは ACID についてもう知っていると思いますので、ACID の説明は省略します。
131 | 
132 | 実装によっては ACID のうち I すなわち Isolation について設定で制約を緩くできるものがありますが、
133 | DBMS 側で性能面の制約が減る代わりに、
134 | 並行実行の結果としての「正しさ」についての責任をアプリケーションも負うことになります。
135 | Isolation については並行実行制御の章でも述べます。
136 | A、C、および D を緩められるシステムというのはほぼ有り得ません。
137 | それができないシステムは少なくともトランザクションを処理できると言わないと思います。
138 | トランザクションという言葉が拡大解釈して宣伝に使われるケースがありますが、
139 | 「それ本当にトランザクション実行できるんですか？？？」という疑問は常に持つようにしましょう。
140 | また、ACD は大丈夫そうだとしても「Isolation はどのくらい担保されるんですか？？？」
141 | という疑問も持つようにしましょう。
142 | 
143 | ====[column] ACID の C についての解釈
144 | 
145 | ACID の C すなわち Consistency については、いわゆる教科書では、
146 | Unique key や Foreign key など、データベース設計者がデータベースに課す制約のことだと説明されています。
147 | ただ、これは本来、アプリケーションがデータに(明示的もしくは暗黙的に)求める制約(としての不変条件)であり、
148 | データベースシステムはそれを手助けする機能を提供しているだけだという解釈ができます。
149 | 最も厳しい Isolation 制約である Serializability が満たされていれば、
150 | アプリケーションは通常の読み書きの範囲内で任意の不変条件が満たされているか検査することができます。
151 | Serializability を満たしているということは、
152 | データベースを読み書きしているのが自分だけであるという仮定を置けるからです。
153 | AID は、データベースシステムに求められる性質そのものであるのに対して、
154 | この意味での Consistency は、本来アプリケーション固有の性質であるという点が異なります。
155 | 
156 | 一部の研究者は、別の分野、並列分散コンピューティングの世界で使われている Consistency の意味で
157 | C を使うべきじゃないかと主張しており、私もそれに同意します。以下の記事が参考になります:
158 | 
159 |  * Overview of Consistency Levels in Database Systems (2019-07-25)
160 |  ** Daniel Abadi
161 |  ** @<href>{http://dbmsmusings.blogspot.com/2019/07/overview-of-consistency-levels-in.html}
162 | 
163 | ここでの Consistency は、より厳密には External consistency と呼ばれる性質だと私は認識しており、
164 | トランザクション間の順序制約をシステムの外から与えるものと解釈できます。
165 | Isolation を Internal consistency と呼んでいる文献があって、
166 | どちらも広い意味では Consistency だという解釈もできます。
167 | External consistency は、Isolation では扱わない、外部起因のトランザクション間の因果や
168 | 実時刻についての制約を扱います。
169 | 明示的に順序制約を与えずとも、トランザクションが Concurrent かどうか(実行時間が重複していると見做せるか)
170 | を判断することは可能で、それに基いた制約として、Strict serializability という性質があります。
171 | これは、Serializable であることに加えて、古いデータベース状態を読まないという実時間上の制約が入っています。
172 | これは Isolation の範囲に収まらず、まさに Consistency と呼ぶに相応わしい概念です@<fn>{consistency-in-distributed-systems}。
173 | 
174 | ここまで読んで、皆さんには Internal と External を本当に厳密に分けることができるのか、
175 | という疑問が湧いているのではないでしょうか。
176 | Serializability だってアプリケーションが求めている性質と解釈できるじゃないか、と。
177 | たぶん、厳密な区別をしようとすると辛いと思います。
178 | もっと突き詰めると、トランザクションを使いたいアプリケーションが真に求める不変条件とは何ぞや、
179 | という議論になるかと思います。
180 | 近年それに関する議論も行われていますので、興味のある人は調べてみるのが良いでしょう
181 | @<fn>{ramp-transaction}。
182 | 
183 | 
184 | ====[/column]
185 | 
186 | //footnote[consistency-in-distributed-systems][データベースの複製が複数存在するシステムにおいて、Consistency という言葉には、複製が同じ状態に収束するという意味合いもあります。ACID を議論するようなトランザクションシステムではそんなことは当然で、かつ、状態の遷移についても厳しい制約を前提にしていることが多いです。]
187 | //footnote[ramp-transaction][RAMP transaction や Coordination avoidance、I-confluent などのキーワードで検索してください。]
188 | 
189 | 
190 | 
191 | == トランザクションシステムの分類
192 | 
193 | 
194 | @<b>{Interactive vs One-shot}:
195 | トランザクションは、One-shot トランザクションと Interactive トランザクションに分けることが出来ます。
196 | One-shot トランザクションとは、トランザクションの開始前に外部から入力データを
197 | 与えて、トランザクションの完了後に外部に出力データを、少なくとも @<tt>{commit} 成功か失敗かを返す
198 | トランザクションのことで、トランザクションの実行中に、外部とのデータのやりとりを行わないものです。
199 | Interactive トランザクションとは、
200 | トランザクション実行中にも外部とのデータやりとりができるものです。
201 | 典型的な One-shot トランザクションは、トランザクションロジックがトランザクションエンジン側で実行され、
202 | 典型的な Interactive トランザクションは、トランザクションロジックがアプリケーション側で実行されます。
203 | 
204 | Interactive トランザクションをサポートする場合、
205 | 主にアプリケーション側にトランザクションロジックが実装されますから、
206 | DBMS とやりとりするために DML などのコマンドをデータと共にネットワーク等を経由して送り合う必要が出てきます。
207 | 当然、そのプロトコルを設計実装しなければ動きません。
208 | 一方、One-shot トランザクションはストアドプロシージャで利用することが想定され、
209 | アプリケーションはストアドプロシージャを指定し、その入力データを DBMS に送り、
210 | 最後にトランザクションの出力のみを受けとるというより簡単なプロトコルで済みます。
211 | また、One-shot トランザクションをサポートしようと考えたとき、
212 | ストアドプロシージャを記述する専用言語と実行ランタイムを用意する方法もあり得るでしょうし、
213 | もう少し楽な方法としてプラグインで実現する方法もあるでしょうが、
214 | さらに楽な方法として、ストアドプロシージャを DBMS と同じコードレポジトリ内に定義してしまい、
215 | 一緒にコンパイルしてしまう方法も考えられます。
216 | 他にも、One-shot トランザクションのみ想定するならアプリケーションとのやりとりの遅延を隠蔽できるので、
217 | より性能を確保したい場合 One-shot トランザクションに特化したシステムは魅力的だと思います。
218 | 2021 年現在、多くの実用的な DBMS (特に RDBMS) は Interactive トランザクションを実行できるように作られています。
219 | ただ、より性能を求めた近年のアカデミアでの研究の多くは One-shot トランザクションを前提にしたものが多く、
220 | 高速さやスケーラビリティを求めた一部のプロダクトでも One-shot トランザクションに特化したものもあります(VoltDB など)。
221 | 
222 | @<b>{Deterministic vs Non-deterministic}:
223 | トランザクション処理エンジンの視点で、得られる情報が多い方が制御しやすいという側面があります。
224 | その観点で、Deterministic workload と呼ばれる Workload があります。
225 | これは、トランザクション開始時にどのレコードを読み書きするか予め全て分かっているという
226 | 仮定を置いたもの(書く方だけ分かっているという前提を置く場合もある)で、
227 | Deterministic workload に特化した DBMS は、
228 | その情報を使って効率的/高速な処理を行なうことができます。
229 | 一般には、トランザクションロジックから読み書き要求が
230 | 発生する度にどのレコードを読み書きするか判明するのが典型的な処理エンジンの置かれている状況で、
231 | これを、Non-deterministic workload と呼びます。
232 | Deterministic/non-deterministic という言葉は、コンピュータサイエンスにおいては別の意味で使われていることが
233 | 多いと思いますので、注意が必要です。代わりに使える概念を表す言葉として、
234 | Decralative/dynamic @<fn>{papa-book} というものがありますが、使っている人をあまり見かけません。
235 | アプリケーションによっては Deterministic workload の仮定を受けいれられるものもあるかも知れませんが、
236 | 一般にこの制限はかなり厳しいものです。いわゆるデータベースの状態に応じてアクセスするレコードが変わるような操作、
237 | 例えば @<tt>{join} は、この仮定を満たさないです。Concurrency Control の章でも説明します。
238 | 
239 | //footnote[papa-book][The Theory of Database Concurrency Control (Christos Papadimitriou, 1986) の 4 章で出てきますが、この本の入手性は 2022 年時点で良いとはいえません。]
240 | 
241 | 
242 | 
243 | @<b>{Embedded vs Non-embedded}:
244 | アーキテクチャの視点でトランザクションシステムを区別することもできます。
245 | 一般に、アプリケーションと DBMS は別プロセスで動きます。
246 | 同一コンピュータで動くこともありますが、別のコンピュータで動いていて、やりとりはネットワーク経由ということも
247 | 珍しくありません。これには例外があり、それが組み込み(embedded) DBMS です。
248 | BerkeleyDB などの組み込み DBMS は、トランザクションロジックコードから
249 | DBMS の機能をライブラリ関数経由で呼び出し、それが直接 DBMS 側のコードを呼び出す仕組みになっています。
250 | つまり、アプリケーションと DBMS のコードが同一のプロセス内で動作します。
251 | 当然、データベースファイルはローカルに保存されている前提です。
252 | BerkeleyDB は Interactive トランザクションを実行するために作られていますが、
253 | 組み込み DBMS であるが故にアプリケーションと DBMS 間でのネットワーク等を介したプロトコルが不要です。
254 | 組み込み DBMS では Interactive と One-shot の区別をする意味があまりありません。
255 | 
256 | 非組み込み DBMS よりも組み込み DBMS の方が簡単に設計実装できます。
257 | ライブラリとして作るよりも、
258 | DBMS のコードに必要なトランザクションロジック等を追加で記述してしまい、
259 | 一緒にコンパイル/ビルド/リンク等してしまうのが一番お手軽かと思います。
260 | 不要であれば入出力の機能すら省略してしまうことができます。
261 | テストやデバッグ、ベンチマークのみを差し当っての目的にするのであれば入出力はほぼ不要でしょう。
262 | 疑似乱数を用いてワークロードを生成するとか、パラメータをハードコーディングするとか、
263 | 使い勝手という点で色々と制約はありますが、トランザクションシステムとしては機能します。
264 | 
265 | 
266 | ここに挙げた以外にも、様々な分類があり得ると思います。例えば、In-memory DBMS とそうでない DBMS や、
267 | Distributed DBMS とそうでない DBMS など……トランザクション処理システムについて考えるときは、
268 | どのような仮定を置いているか、その仮定は(そのときの目的にとって)妥当か、という視点を常に持つようにしましょう。
269 | 
270 | 


--------------------------------------------------------------------------------
/wal.re:
--------------------------------------------------------------------------------
  1 | = 永続化
  2 | 
  3 | 
  4 | 一般に、コンピュータ上のプログラムは揮発性のメインメモリ上でプロセスとして動作しますが、
  5 | データベースの寿命はプロセスや、それが動いているコンピュータのハードウェアよりも長かったりします。
  6 | 永続化は、そのような制約を越えてデータベースを永続的に保持するための処理を意味し、
  7 | その第一歩はデータベースやその差分をディスクに保存することです。
  8 | そのための要素技術が、Write-ahead Logging や Checkpointing です。
  9 | 
 10 | 
 11 | 
 12 | == そもそも Log って何でしょうか？
 13 | 
 14 | Log はトランザクションによるデータの変更後のもしくは変更前の差分データのことです。
 15 | 変更後のデータを Redo log、変更前のデータを Undo log といいます。
 16 | より厳密にいえば、トランザクション実行前の状態から実行後の状態を作れるだけの情報を持っているものが
 17 | Redo log、実行後の状態から実行前の状態を作れるだけの情報を持っているものが Undo log です。
 18 | ごく稀に、Read log、すなわちトランザクションが何を読んだかという Log
 19 | について考えることがありますが、効率の面からあまり現実的ではありません。
 20 | 通常、Log はデータベース本体のデータとは別に記録されます。
 21 | 
 22 | どのレベルの表現で Log を扱うかという設計の選択肢があり、
 23 | Logical logging と Physical logging に大別されます。
 24 | Logical logging とは、SQL 文や、ストアドプロシージャの ID とその入力など、抽象度が高い表現を意味します。
 25 | Physical logging とは、Record や Record よりももう少し大きな物理構造である Page/block などの表現を意味します。
 26 | Log の容量を小さく保つことよりも性能のことを考えると、Record 単位の Physical logging を
 27 | 用いたくなることが多いのではないかと私は思います。
 28 | 
 29 | 
 30 | == 何のために Log はあるの？
 31 | 
 32 | Redo log はその名の通り Redo するための Log、トランザクションがあったことにするためのものです。
 33 | Undo log は Undo するための Log、トランザクションをなかったことにするためのものです。
 34 | Logging は ACID 特性の、A (Atomicity) と D (Durability) を実現するための仕組みです。
 35 | 我々は Crash が発生し得る世界で、トランザクションを Atomic に実行し、永続化したいです。
 36 | しかし、Crash が発生したときは、データベース本体のファイルが中途半端な状態になってしまうことは避けられません。
 37 | というのも Atomic にしたい複数操作が実際には Atomic に永続化できないからです。
 38 | Log があれば、Crash 直後のデータベース本体ファイルが中途半端な状態から、
 39 | 全てのトランザクションについて、あった/なかったのどちらかの状態に回復できます。
 40 | もちろん、前提として、とある性質を満たす必要があり、詳細は Crash recovery の節で述べます。
 41 | Commit しましたよとクライアントに返事をしたトランザクションは必ず Committed 状態でなければならず、
 42 | 後からそれが覆ったりしてはいけません。
 43 | 
 44 | 
 45 | == Write-ahead Logging って何？
 46 | 
 47 | トランザクションを後からあったことにする/なかったことに出来るなら
 48 | どんな方法を採用しても良いのですが、
 49 | 「先行」して書く方法が 1991 年の ARIES 論文が発表された前後から主流となっています。
 50 | (NVRAM の台頭で変わるかも知れません……)
 51 | この「先行」方式を Write-ahead Logging (WAL、ワル) と呼びます。
 52 | 先に Log を書いておけば、いつ Crash が発生したとしても、
 53 | データベース本体の中途半端な状態から回復するために必要な Log が
 54 | 永続化されている状態を保つことが可能です。
 55 | 
 56 | この方式では WAL ファイルに追記していけば良いことから、
 57 | シーケンシャルアクセスがランダムアクセスよりも高速であり、永続化にも追加の操作(@<tt>{fsync} 相当)を必要とする
 58 | HDD とは相性が良かったのです。
 59 | 並列に WAL を書く方法も最近は(少なくとも研究レベルでは)当たり前になりました。
 60 | (並列じゃない WAL をシングル WAL、並列のものを パラレル WAL と区別して呼ぶことにします。)
 61 | 似たような方法として、ファイルシステムのジャーナルも WAL の考え方を採用しています。
 62 | 例えば Linux OS で広く使われている ext4 ファイルシステムは、
 63 | メタデータ操作を Atomic 実行の対象として、Crash しても @<tt>{fsck} (という名の全メタデータチェックツール)
 64 | の実行が不要な(Crash recovery 相当のジャーナルリプレイ操作のみ必要)仕組みを採用しています。
 65 | 
 66 | 
 67 | 
 68 | == Redo/undo log は両方必要？
 69 | 
 70 | データベース本体ファイルへの変更の反映についての制約を一番緩いものにしたければ両方必要ですが、
 71 | 必要な制約を守れば片方だけでも事足ります。
 72 | あるトランザクションの時系列による状態の変化に注目して考えてみましょう。
 73 | 
 74 |  * (1) トランザクション開始から Commit/abort 命令発行直前まで
 75 |  * (2) Commit/abort 処理の実行中
 76 |  * (3) Commit/abort 処理完了後
 77 | 
 78 | ここでは、話を簡単にするため Redo log、Undo log、Commit/abort log しかないものとしましょう。
 79 | Commit/abort log は Log の中で最後に書きます。
 80 | これは、Commit log が永続化されていれば、そのトランザクションの全ての Log は永続化されている
 81 | という性質を満たすためです。
 82 | Commit log が永続化されていないトランザクションは Abort 扱い(なかったこと)になります。
 83 | ひとつひとつの Log の適用 (Redo もしくは Undo 操作のこと)は Atomic に実行できるものとします@<fn>{footnote_double_write}。
 84 | また、同じ Log を複数回適用しても結果は変わらないものとします(べき等性)。
 85 | それぞれの Log を適用する順序には制約があることには意識しておいてください。
 86 | 同一の Record に対する Redo log 適用の順序は Log を書いた順@<fn>{footnote_log_apply_order}、
 87 | Undo log 適用の順序は Log を書いた逆順となります@<fn>{footnote_compensation_log}。
 88 | 
 89 | //footnote[footnote_double_write][実際は Atomic に操作できなかったりするので、Double write するなどの工夫が必要です。]
 90 | //footnote[footnote_log_apply_order][厳密には Serialization order の順となりますが、S2PL プロトコルを前提とすれば Log を書いた順です。パラレル WAL 方式では何らかの方法で順序を担保する必要があります。]
 91 | //footnote[footnote_compensation_log][Undo log の適用そのものをそのままべき等にすることは難しいので、Undo log の適応に際してCompensation log なる Log を出力し、Undo 処理を Redo log として記録します。Undo 実行中の Crash に対しては、Redo phase に Compensation log が適用されることで Undo 途中の状態が再現され、Undo phase でまだ実施していない Undo の続きを実行します。これにより、対象を確実に 1 回だけ Undo することが可能になります。]
 92 | 
 93 | 
 94 | === Redo log しか書かない (Undo log がない) システム
 95 | 
 96 | Undo log がないということは Undo できないので、一部でもデータベース本体に変更を反映したトランザクションは、
 97 | 必ずあったことにしないとけません。
 98 | ということは、少なくとも (1) の間にデータべース本体のファイルに変更を反映できないという制約が発生します。
 99 | さらに、Commit が確定する(当該トランザクションの Log が全て永続化する、
100 | かつ、それが依存している全てのトランザクションの Commit が完了している)まで、
101 | データベース本体に変更を反映できないという制約も発生します。
102 | つまり、(3) になって始めてデータベース本体のファイルに変更を反映しても良いことになります。
103 | (あくまでディスク上のファイルについての話であって、メインメモリ上では通常もっと前に反映されています。)
104 | すなわち、Commit log の永続化が終わってからデータベース本体に反映を開始することになります。
105 | 
106 | 
107 | === Undo log しか書かない (Redo log がない) システム
108 | 
109 | Redo log がないということは Redo できないので、データベース本体に変更を反映するまで Commit したことにできません。
110 | Undo はできるので、(1) の間でも Undo log が永続化済みの操作は、どんどんデータベース本体に反映して問題ありません。
111 | (2) において、Commit が確定するためには、当該トランザクションの Log が全て永続化する、かつ、データベース本体への反映が永続化も含めて終わっている、かつ、依存しているトランザクションが Commit 完了している必要があります。
112 | つまり、Commit log はデータベース本体の永続化が完了してから書くことになります。
113 | (3) においてそのトランザクションについてやるべきことはありません。
114 | 
115 | 
116 | === Redo log と Undo log の両方を書くシステム
117 | 
118 | 片方しかない場合に比べて制約が大幅に減ります。
119 | 必要な制約は、Redo/undo log を永続化してから対応する操作をデータベース本体ファイルに反映開始することのみです。
120 | Commit に必要な条件は、Commit log まで永続化が完了する、かつ、依存しているトランザクションが Commit 完了していることです。
121 | 途中までデータベース本体に反映したところで Crash しても、Undo log は永続化されているので
122 | トランザクションをなかったことにできますし、
123 | Commit log が永続化していれば Redo log は全て永続化しているのでトランザクションをあったことにできます。
124 | 
125 | 
126 | 図にするとより分かりやすいと思いますが、自分で書いてみてください(えっ)。
127 | 
128 | 
129 | 
130 | == Crash recovery
131 | 
132 | Crash が発生した直後のデータベース本体ファイルは中途半端な状態になっています。
133 | これを Log を使って各トランザクションがあった/なかったのどちらかに確定させ、
134 | データベースの永続データを一貫性のある状態に修復します。
135 | まず、Log を先頭からなめて、トランザクション毎にあった/なかったのどちらにするか決定します。
136 | あるトランザクションを「あった」ことにする条件は、
137 | 
138 |  1. トランザクションの全ての Log が永続化済みである(Commit log が記録されている)
139 |  2. トランザクションが依存していた全てのトランザクションが Commit 扱いとなっている
140 | 
141 | です。
142 | 
143 | (2) をきちんと考え始めると、込み入った話になります。トランザクションの「依存」とはなにかということです。
144 | トランザクション B が トランザクション A に依存する関係は、
145 | A が書いた Record を B が読んだときに成立します@<fn>{footnote_reads_from}。
146 | A が Abort 扱いになるのであれば、A の書いた Record データはなかったことになるので、
147 | それを読んでしまった B もまた Commit できないということです。
148 | このケースで、B を先に Commit してしまうと、A が Abort してはいけませんが、
149 | 実際には Crash によって A が Abort する可能性を排除できないので、破綻します。
150 | 破綻を避けるには A を Commit してから B を Commit する必要があります。
151 | この制約を Recoverability といいます。
152 | 
153 | //footnote[footnote_reads_from][Reads-from 関係ともいいます。B reads from A とか B reads x from A といったりします。]
154 | 
155 | Recoverability よりも強い制約として Strong recoverability があり、
156 | Serialization order の順に Commit することを意味します。
157 | Strong recoverability を DBMS が満たせば (1) が満たされたとき (2) も自動的に満たされるようになるので、
158 | ここでは Strong recoverability を前提として (1) のみを気にすることにします。これなら簡単ですね。
159 | 詳細は@<secref>{memo|sec-recoverability}に書いておきました。
160 | 
161 | Commit log を永続化した後に Commit 成否はユーザ/アプリケーションに通知されているはずですから、
162 | Commit 成功したと通知されているトランザクションは全て Commit log が永続化されているはずです。
163 | そのようなトランザクションは (1) を満たすわけなので、必ずあったことになります。
164 | 
165 | トランザクションをあった/なかったのどちらにするかを決定した後は、
166 | あったことにするトランザクションを Redo します(Redo log がないシステムでは不要です)。
167 | 最後に、なかったことにするトランザクションを Undo します(Undo log がないシステムでは不要です)。
168 | Log 適用の順番には気をつける必要があります。
169 | シングル WAL であれば、最も単純な方法として、Log の書かれた順番を守って適用すれば問題ありません。
170 | 必要とされる性質は、DBMS が並行実行制御で決定したトランザクションの順序(一般に全順序ではなく半順序です)
171 | に矛盾しないように適用順序を制御します。
172 | その制御のために Log に必要な情報を含める必要があります。
173 | どんな情報が必要かは並行実行制御プロトコルや WAL 方式に依存します。
174 | 半順序関係を満たせば良いということは、理論上は並列に Log 適用することも可能です。
175 | 
176 | 
177 | 
178 | == Checkpointing
179 | 
180 | Log はいつまで残しておけば良いでしょうか？
181 | それは、Log に対応するトランザクションが完了していて、
182 | 当該トランザクションの全ての Log の操作がデータベース本体ファイルに反映され終わるまでです。
183 | それらの条件が満たされた Log はもう不要なので、消すことができます。
184 | メインメモリが大量にあったり、そもそもインメモリデータベースなどでは、
185 | データベース本体ファイルへの変更の反映をずっとずっと先延ばしにすることが可能です。
186 | 先延ばしし続けると Crash recovery 時に適用しなければならない Log が増え、
187 | Crash recovery にかかる時間が長くなってしまうだけでなく、
188 | いつまでも Log を消せないということになります。
189 | それを防ぐために行う操作が Checkpointing です。
190 | Checkpointing とは、先延ばししていたデータベース本体ファイルへの反映を実行して、Log を消す作業です。
191 | プロトタイプを作る場合は実装が後回しになる機能だと思いますが、
192 | 長時間 DBMS を動かし続けるためにはなくてはならない機能です。
193 | 
194 | 素朴には、データベースの全データを書き出せば Checkpointing できますが、
195 | 書き出しの途中でトランザクションが実行された場合、書き出されたデータは
196 | 一貫性のある Snapshot ではなく、中途半端なデータベース状態です。
197 | 詳細はここでは述べませんが、この場合はこれを Log と組み合わせて一貫性のある Snapshot を作り出す必要があります。
198 | 最近は、一貫性のある差分をうまく非同期的に出力する方法も模索されています。
199 | また、Log を使って古い Snapshot から新しい Snapshot を生成する方法もあります。
200 | 新しい Snapshot があれば古い Log は消せますから、Checkpoinitng の目的を達成できるというわけです。
201 | 並列 Logging およびデータベースが分割 (Partitioned) されている前提であれば、
202 | Map-reduce のような処理をして、古い Snapshot から新しい Snapshot を作ることになります。
203 | @<secref>{next-step|sec-direction-for-durability}にもう少し詳しく書いておきました。
204 | 
205 | Checkointing の良さの指標とは、差分を取り出すためのオーバーヘッドが小さいことと、
206 | 新しい Snapshot を作るためのコストや時間が小さいことです。
207 | 後者は、滞留する Log の量が許容量を越えなければ実用的だと言えます。
208 | 追い付けない場合はシステム運用が破綻するので、オンライン処理にバックプレッシャーをかけて遅くする必要さえあり得ます。
209 | Checkpointing の手法を考えたり、設計したりする場合は、これらの指標を意識してください。
210 | 


--------------------------------------------------------------------------------