紹介
デジタルなアプローチをこれから進めたい歴史研究者のために。
大規模なテキストデータをどう扱っていけばいいのか。歴史研究におけるデジタルツールおよびその技術を利用するための実践的な入門書。
冒頭で「デジタルヒストリーの文脈」としてその歴史を解説。以降、研究課題の設定から、デジタルプロジェクトの始め方、プレーンテキストと構造化テキスト(XML)の処理方法、プロジェクトの管理の方法、データをどう可視化するか、など研究のライフサイクル全体を視野に収めた解説を行います。また今回の日本語版では、補論「構造化テキストの構造を活かした処理」を収録し、一歩進んだテキストデータの扱い方についても解説しました。
これからのデジタルヒューマニティーズあるいはデジタルヒストリーの方法論の「民主化」のために。
歴史研究者だけでなく、文学研究ほか、人文学研究者必携の書です。
【デジタルヒストリーにはさまざまな面がありますが、中には特定の分野や特定の研究者に適したものもあります。この本を読んだ歴史研究者が、何か新しいことに挑戦したり、これまで以上にデジタルなアプローチを進めたりするきっかけとなるならば、私たちとしてはこれに勝る喜びはありません。】……はじめにより
目次
謝辞
はじめに
目的/構成
第1章 デジタルヒストリーの文脈
はじめに/デジタルヒューマニティーズとデジタルヒストリー/技術的変化/発見する/叙述する/引用する/結論
第2章 研究課題を設定する
はじめに/どのようなデジタル史料があるか?/デジタル化は研究を変えることができる—『ハンサード』を例に—/「デジタル化された」とは何を意味するのか?/デジタルデータへのアクセス/ボーンデジタル史料を利用する/テキスト、データ、メタデータ/研究成果発表/結論
第3章 デジタルプロジェクトの始め方
郵便住所録の紹介/住所録をスキャンする/OCRと手入力/Gitと確認/テキストデータのクリーニング/正規表現で構造を追加する
第4章 テキストを扱う(1):非構造化テキスト
データの文脈を知ること/プレーンテキスト/テキストを相手に作業を行う/ケーススタディ:郵便住所録での住所のパターン/検索と置換/コマンドライン入門/GREP/コマンド同士をパイプで接続する/確認テスト
第5章 テキストを扱う(2):構造化テキスト
女性の職業/独自のマークアップを施す/Text Encoding Initiative/確認テスト
第6章 デジタルヒストリーのプロジェクトを管理する
データ管理/データ管理とバージョン管理/バージョン管理/Git/ドキュメンテーション/データ共有
第7章 データの可視化
可視化と歴史実践/数値データの可視化/地図
第8章 デジタルヒストリーのこれから
ボーンデジタル一次史料/透明性とオープン性/倫理的研究、プライバシー、包括性/テキストを超えて、検索を超えて/環境の反動?
確認テストの解答例
付録1:データの入手方法
付録2:コマンドラインのレシピ
付録3:正規表現
用語集
参考文献
図版一覧
表一覧
訳者あとがき
補論
〜構造化テキストの構造を活かした処理〜
小風 尚樹・永崎 研宣
【コマンドライン編】
grep検索の得手不得手/XMLの解析(パース)/Xmlstarletのインストール/パースによるXML検索の簡単な例/Windowsでのコマンドラインの色々
【プログラミング編】
元データの確認/正規表現を用いたデータセット中の男女比の算出/女性の職業一覧を多い順に並べ替える/おわりに
索引