Supplementary information etc.
パソコンがあればできる! ことばの実験研究の方法(ひつじ書房)

本ウェブサイトについて
本ウェブサイトは、『パソコンがあればできる! ことばの実験研究の方法 第2版〜容認性調査、読文・産出実験からコーパスまで』(ひつじ書房刊)についての正誤情報や追加情報などを蓄積するサイトです。
本書は、PCでできる実験手法を紹介したものですが、実験に使うソフトウェアは、基本的にオンラインだということもあり、書籍の出版のスピードよりはるかに速い速度で日々アップデートされています。したがって、本書の内容が古くなったり改訂しなければならないケースが出てくるかと思います。その補遺とするのがウェブサイトの趣旨です。また、読者のみなさんからの正誤情報もいただければありがたく存じます。よろしくお願いいたします。
(なお、基本的なインストール方法などについての質問については、著者一同の時間・労力的リソースが限られているため、対応できないことを予めご了承ください。)
What's new
第7章 CHILDES Browsable Database 補遺 (2024.07現在)
本書第2版が出版された後にCHILDES Browsable Databaseの仕様の一部が変更されました。そのため、本章に書かれている内容のままコマンドを作っても動作しないことが発生しております。CHILDES Browsable Databaseを使用する際は、以下に示す変更点を確認するようよろしくお願いいたします。
- CHILDESはかつては登録無しでも利用できましたが、現在は登録(無料)が前提となっています。p. 222 「3. DatabaseのコラムにあるBrowsable Databaseをクリックする」の次に、TalkBank Login画面が出てくるため、初めて使用するときはアカウント登録をします。
- 日本語コーパスでは、かつては<CHIやMOTなどのメイン・ティアにローマ字表記、%ortティアに日本語表記>が割り振られていましたが、アップデートされた一部の(すべてではありません)コーパスでは、逆に<メイン・ティアに日本語表記、%ortティアにローマ字表記>が入っています(例えばMiyataコーパス)。その場合は、本書にあるように+tCHIでローマ字検索しても引っかかりませんので、日本語を検索キーにするか、+t%ortを加えてローマ字検索する必要があります。データを検索する前に生データを見て、メイン・ティアがローマ字表記か日本語表記かを確認してください。
-
例えば、p.230 図5の検索の場合、Nojiコーパスならば図5の通りで検索できますが、Miyataコーパスなら以下のように入力します。
freq +tCHI +t%ort +syo +sne +u +o *.cha もしくは
freq +tCHI +sよ +sね +u +o *.cha - 今回は終助詞を例に挙げていたため、ひらがな表記のみでした。そのため、「+sよ」や「+sね」でも問題ありません。しかし、「+t%ort」を用いる手法をお勧めします。なぜなら、日本語表記はひらがなとカタカナと漢字が混ざっているからです。一方、ローマ字表記では何がひらがなで何がカタカナで何が漢字で表記されているかは心配する必要がありません。
- p.233 上記と同様のことがkwalコマンドやcomboコマンドでも発生していますので、メイン・ティアが日本語のコーパスを検索する場合は、+t%ortを付け加えるか、検索キーを日本語で入力してください。
- 英語のBrownコーパスでも、%morの記述方法が変わっており、テキスト通りの+sの指定の仕方では結果がヒットしません。たとえば、指示詞のthatは執筆段階ではdet:dem|thatでしたが、現在はdet|that-Def-Demとなっています。今後も表記法が変わる可能性があります。最新の記述法を調べるには、実際のファイルを開いて確認してみてください。