00:00
英語史の研究より英語史コーパスについて語ります。と題しまして、新著の第2章でも本格的に取り上げているんですけれども、そこをですね、対談という形で語ります。
英語史のコーパスについて知りたい人多いと思うんですね。これを聞いて、これからコーパスとどう付き合っていけばいいのかということについて考えをめぐらせていただければと思います。
20分ほどのですね、2つのチャプターに分けてのおしゃべり会となったんですが、私自身も大変勉強になりました。ビッグゲストの登場ということでですね、皆さんも楽しく聞いていただきまして、学んでいただければと思います。
各チャプターに家入先生のウェブ上での発信のソースですね。ウェブリソースについて、それぞれ異なるチャプターに異なるリンクを貼っておきますので、そちらから家入先生の英語史に関する発信、こちら注目していただければと思います。
それではどうぞよろしくお願いいたします。
今日はですね、文献学と英語史研究という本につきまして、前回ですね、家入陽子先生においでいただきまして、ざっと本書の紹介をしたということなんですけれども、今日も改めて家入先生にご出演いただきまして、いろいろとお話を伺いたいと思います。
家入先生よろしくお願いいたします。
よろしくお願いします。
はい、前回はざっと本書の紹介という形だったんですけれども、今回はその周辺といいますか、あるいは中の一部を取り出して、自由におしゃべりさせていただきたいと思うんですけれども、
多くの英語史を研究されている方であるとか、これから研究してみたいという方に関心があるのではないかと思うのは、2章で取り上げた資料とデータというところだと思うんですね。
いわゆるコーパスもそうですし、電子辞書、歴史辞書ですね、電子的になっている辞書もそうですし、それから方言地図等もあるんですが、
先生はだいぶこの様々な世代のコーパスというのを使いこなしてこられて、これまでもそれで研究され、論文を書いてということでですね、やられてきたと思うんですが、
この英語史関連のコーパスについてお伺いしたいんですけれども、今数があって、この本の中でも取り上げられたのは本当に一部ですよね。
代表的な、これどう整理すればいいのかということなんですけれども、この話、お話聞かせいただけますでしょうか。
03:06
なかなか本当に量が多すぎて、ある意味で私もいろんなところで、コーパス言語学が終わる時っていうようなことを言ったりしているんですけれども、それは何かというと、
コーパスが普通の文献研究の普通のツールというふうになっていって、わざわざコーパスを言わなくていいっていう、そういう時代が来るんじゃないかということもずいぶん前から言っているんですが、まさにもう今それに近い状況にあるのかなという感じがします。
来ましたかね、この40年ほどで、確かにもう盛んに最初の頃はコーパスリングイスティックスみたいな言い方で、その方法論が模索されたりということはあったんですが、今なんかでも学会の発表なんかでも特に海外ですかね、コーパスを使わない研究、前提としない研究っていうのはほとんど見なくなったと言いますかね。
ちょうど私が大学院生ぐらいの時にヘルシンキコーパスというのがみんな使い始めた、そういうふうな時代の関係なんですね、私の研究した人生というか。その頃はもう本当にヘルシンキコーパスぐらい、もちろんよく今から振り返ってみるとそれ以外にもあったんですけれども、コンピューターの性能自体の問題もあったりして、まだみんながあんまり自由に使えるコーパスというのがそんなにたくさんはなかった時代。
その頃っていうのは学会発表でコーパスを使うっていうのも若干特別なことだったし、使うとすればみんなヘルシンキコーパスを使っているというところからスタートしました。
だけどここ数十年の間に本当にハードの方の進展もすごいし、それからコーパスの種類も随分増えてきたなというふうに思いますね。
そうですね。2人3脚ですかね、ハードとあと研究者がコーパスを変算するっていう作業がですよね。私も学生の頃にはヘルシンキコーパスはやはり基本第一の英語詞関係のコーパスだということで、それからあと関連してコーパスではないんですがOEDがCD-ROM化されたりして、コンピューター上で扱えるようになった等がありましたかね。
辞書も、辞書そのものの使い方自体が変わってきたという感じがしますね。変わりましたよね。
検索するという概念ですよね。
辞書ってアルファベットで引くということしかなかったのが、検索するっていう概念があっという間に広がってきましたよね。
ここから得られる情報っていうのがまた単語単語にアプローチする場合と違うビジョンが見えてくるっていうところがやっぱり大きいと思いますね。
コーパスっていうのは本当に電子時代のツールという感じなんですが、辞書っていうのはある意味では旧来のメディアだったものがコンピューターに乗ったっていう感じですよね。
同じことが方言地図についても実はそうで、マニュアルでいちいちトレーシングペーパーでラルメなんかやってたっていうことで。
06:10
私もその世代で最初の頃からトレーシングペーパーを作りました。
私はトレーシングペーパーは話で聞いただけでやったことはないんですけど。
私やりましたよ。
それが本の形でラルメというものになって、本で使っていたんですが、あれはあれよという間にその姉妹版である初期中英語版であるレイミーがまずオンライン化し、
オンライン化しっていうか、そもそもオンラインで登場し、ラルメも電子化しみたいな形で、それがもうダダダッとこのやはり2000年あたりを交差解除して。
本当に2000年をまたぐ時代っていうのをものすごく大きな変化が英語学、もちろん英語学だけじゃなくていろんな学問にそうなんだと思いますけれども、起こった時代っていう感じがしますね。
これついていくのもやっぱり大変なほどで、我々の大学でこの3年ぐらいコロナついていくのもアップアップだったのと同じような感じで、英語史研究のコーパス化とか電子化みたいのも本当に勢いがありすぎてアップアップですよね。
今、英語の歴史関係だけでコーパス集めるとどれくらいになるかっていうと数十を超える、もしかしたら100とか近いかもわからない。
50で作っているものとか小さいものを入れたらもう相当な数だと思いますね。
そうですよね。
そういう意味ではヘルシンキ大学がそれを整理してくれて、そこでもう全然モーラ的とは言えないんですけれども、ある程度整理してくれて、どこに行けば見ることができるかっていう、そういう整理をしていくっていうのもこれからの一つの作業になっていく。
そうなりますよね。
英語史のコーパスという言い方なんですが、これ本書の中でもイエリー先生触れられていると思うんですが、現代英語のコーパス、例えば典型が口科と呼ばれるものだったり、BNCだったりするんですが、それとの歴史的なコーパスとの接続みたいなものによって英語史そのものが、ある意味業界そのものが大きくなってきているっていう点はすごく面白いなというふうに読んでいます。
この現代と歴史的なコーパスとの接続みたいなことについてお話いただけますでしょうか。
そうですね、これは結構やっぱりコーパス時代の、ある意味でいい意味での変化というふうに言えるんじゃないかと思います。
英語史研究というとどうしても数字的な研究だろうというふうに皆さん思われるかもしれないんだけれども、それぞれの研究分野だと、ものすごく少ない時代、特定の時代だけ扱っている研究者というのは昔は多かったと思うんですね。
そちらの方が普通だったかもしれない。私は中英語の専門ですとか、小英語の専門ですという場合が多かったと思うんですけれども、今は縦軸でいろんなことを見ていく中で、もちろん自分の専門ということに焦点を当てることにはなるんでしょうけれども、他の時代との関係性というのを常に意識する時代になってきたのかなと思います。
09:19
だから現代英語の方からスタートする場合でもやっぱりその歴史がどういうふうになっているかという視点は入ってくるでしょうから、相互に乗り入れしてきたかなという感じがしますね。
なるほどね。確かに時代ごとのコーパスっていうのは、今でも基本的にはある程度数百年の枠があったとしても、時代ごとになっているコーパスのほうが多いと思うんですよね。
そうしますと縦にできるようになったのはそうなんですけれども、一つ一つ異なる時代の異なるコーパスとか仕様みたいなのを利用しなければいけなくなって、それこそコーパスリテラシーみたいなものっていうのが必要になってくるのかなという、新しいやり方ができたからこその新しい問題って言いますか、こともあるのかなと思いますね。
そうですね。本当に誰もがヘルシンキコーパスぐらいしか自由にアクセスできなかった時代っていうのは、ある意味でそこはもう決まってたから楽だった部分もあるんですけれども、今はもう選択肢が非常に多いので、どういう目的でどういうふうに使いたいのかっていう、そういう位置づけをいつも考えないといけない、そういう時代が来てるかなという感じがしますね。
そうですね。ざっとこの数十年間のコーパスの歴史を変算されてきた、そして利用されてきた歴史を振り返って、この本の中でも第一、第二、第三世代っていう言い方がありますよね。必ずしも綺麗にはまるものばかりではないといえ、整理するには非常にわかりやすい概念かなと思うんですけれども、この辺り、次のチャプターで簡単にお話しいただければと思います。
それでは、第一世代、第二世代、第三世代と言い習わされるコーパスのこの世代っていう考え方、捉え方なんですけれども、第一世代ってまずはどういうことなんでしょうか。
そうですね。だいたい歴史的なコーパスに関していう場合には、典型的にヘルシンキコーパスが第一世代のコーパスになってくるかなと思うんですけれども、このぐらいの時代っていうのは、現代英語のコーパスがすでにありましたから、その考え方を受け継いで、コーパスっていうのは基本的には言語資料のサンプルだったという考え方です。
そのサンプルをどういうふうに調合して一つのコーパスを作り上げるかということになってくるんですけれども、できるだけバランスを意識した形で、そのサンプルを見ることで全体が見えるということを意識した変算の仕方っていう、ある意味でコーパスの一番一般的な考え方に基づいて変算されたコーパスになるかなというふうに思います。
12:04
いわゆるレプリゼンタティブという言い方でなされる代表性ということが、まず試されたのが第一世代であるということで。
歴史の場合はやっぱり結構難しいですよね。代表性というか、残っている文献というのが非常にいびつな形で残っている場合が多いので、相当苦労されたと思います。このコーパスを変算された時っていうのは。
そうですね。あれは、古英語から近代初期辺りまで通じて確かにできるという利点があって、皆さん利用したわけなんですけれども、ジャンルが全く異なっていて、やはり各時代で、これ縦に見てレプリゼンタティブかというと、やっぱりこれ限界があるといいますか。
やっぱりね、その文献学の難しさっていう、歴史を使うものの難しさがありますよね。
変算者の問題じゃないですよね。
何が残っているかということなので。
ありがとうございます。そして、その後に第2世代という時代が展開してくるわけなんですが、これはどういうコーパスのことなんでしょうか。
これは特殊ジャンルに特化した世代ということになりますね。だから書簡のコーパスであるとか、それから医療関係のジャンルに特化したテキストを集めたコーパスとか、そういうようなジャンルを決めて、その分野の文献を集めていくという考え方です。
なるほど。その第1世代が要はジェネラルとしたら、第2世代はスペシフィックなあるジャンルに。
逆一方、揺れ戻ったという感じで、非常に面白いんですけど、でもこれ第1世代が生み出したものだろうというふうには思います。
第1世代で、一つのコーパスの中にいろんなジャンルが入っていたからこそ、ジャンルごとの違いを見ていきたいという思想につながっていったんじゃないかなという。
なるほど。じゃあ、ジェネラルでやってみたことで、かえってスペシフィックなところにも関心が向き始めたということですかね。それが第2世代ということで、これもどんどんスペシフィックなので作りやすいと言えば作りやすいですよね。先ほどの第1世代に比べて。
代表性ということで言うと、そのジャンルに関しては言えるかもしれないけど、今なってきますよね。
ここで多くのコーパスが、新たに第2世代的なコーパスが変算されるという時代がやってきたということで、そして次の展開が第3ということなんですが、これはどういうことでしょうか。
そうですね。そこから次にどういう風な方向に進んでいくかということなんですけれども、結果的に自由に研究目的に合わせてコーパスを自分で作っていくという考え方ですね。
だからこの第3世代というのは、第3世代コーパスというのが何かどこかに存在しているというよりも、それぞれの研究者が自分の研究目的に合わせて、いろんなものをいろんなテキストをまとめてコーパスとして使っていくという。
15:05
これだから考え方、どちらかというとコーパスについての考え方という風に言った方がいいんじゃないかなという風に思います。
なるほど。それを体現した何か一つのコーパスがあるかというと、必ずしもそういうわけではないということですね。
それぞれの研究者が自分に合わせて作っていくという、そういう考え方ですね。
既存のコーパスをいかに組み合わせるかであるとか、あるいは既存のコーパス自体もある意味変算者の都合といいますかね、ポリシーで作られているので、うまく自分の研究に合わないという場合に作らなければいけないということで。
実際、私は組み合わせるぐらいはやったことがあるんですけど、作る、自分のものを変算するということはないんですが、
イエイ先生はそれもやられていって、作ってしまうということのメリット、デメリットというか、なかなか大変そうだなという印象が作ったんじゃないですかね。
大変ですね。
それが第三世代なんですけど。
そうですね。
多くの研究者がやっぱり、いろんな考え方を持って作るんだけれども、コーパスを作るのがすごくエネルギーを使うので、作った段階で終わってしまうという事例をたくさん見ていますよね。
ただ、以前に比べるとずいぶん作りやすくなってきているかなというふうには思います。
これはその元の。
RJのデジタルで存在していたということがありますしね。
それを自分の目的に沿って集めてデータベース化していくという、要するにそういうことなんでしょうかね。
既存のコーパスってやはりその変算者の思想なり言語感に基づいた、例えばタグ付けなんかがされていて、非常に使いにくいことって多いですよね。
自分の研究のためには。
ピタッと合わないというか。
コーパスの構造に研究が影響されているというのは本当に逆ですよね。
自分の研究目的のためにコーパスを利用するんだけれども、ちょっとまだコーパスに利用されるみたいなところが全然ないとは言えないので、ここから脱却しようという動きですかね。
そうすると、それを克服するためには結局自分で作るしかないということになるんですが。
やはりこれ相当な時間的労力もかかるということがありますし、今そのデータ量がものすごいじゃないですか。
そのどれを取っていくかっていう、それこそ第1世代のリプレゼンタティブの問題にまた舞い戻っていくというような怖さがあるビッグデータ的な、そのあたりは巨大さについてはどうお考えですかね。
これも本当にいつも議論があるところですね。大きい方がいいのか、それとも小さくてよく見えるものの方がいいのか。やっぱり両方だと思うんですよね。
18:00
大きい方がいいっていう考え方の中には、言語現象の中には非常に稀なものもあるので、ある程度大きくなるといけない。それも正しいだろうと思いますし、
一方で、あまり大きすぎて非常に淡白な研究になっていくっていう危険性は常にありますよね。
そうですね。EVOというコーパスを用いて、オンライン化されているもので、昨年2022年でしたっけ、
イエリー先生と一緒に論文を書いた時、あれももうバカでかいコーパスで、つづり字の問題で、エティモロジカルスペリングの話題で、一番やりたいのがダウトだったんですけど、
ダウトは頻度が高すぎて、何万件とかですかね。もうちょっと扱えなかったという。しょうもないくらい目立たない単語ばかりでやった感じが、結果的には。
大きすぎると、やっぱりそういうことが起こってくるのかな。どうしてもコーパスやっていると関係がないデータが引っかかってきて、それを捨てなきゃいけない。
その作業がものすごく大変になってくるかなという感じがしますね。
最初からある程度整理されたコーパスであれば、そういうゴミに相当するものでは少ないけれども、巨大すぎると排除もできないというところですよね。
巨大化の方向というのも一つ、どんどん続いていく可能性は。
ある程度ね、そっちの方に行くのかなというふうには思いますね。
そうしますと、第3世代まで来て、第3世代というのはコーパスの使い方というか、そういうことだというお話だったんですが、今後は、例えば第4世代であるとか、何か展開はコーパスについてあるとお考えでしょうか。
どうでしょうね、日常的なものになってきたので、わざわざコーパスを意識しない。ある意味で自然体で自分の興味に従って、だから何がコーパスがあるかないかということはあまり意識しない。
何らかの資料はあるわけですが、自然体でもっと研究テーマの方に意識を向けることができる時代がある意味できてるんじゃないかなという気はしますけれどもね。
コーパスからむしろ解放されるといいますか。
自由になっていくというか、コーパス言語学が終わるときというところで言ってるんですけれども、ある意味で昔に戻ったというのかな。
昔はその文献を読みたいものにアクセスするという形でやってたわけですから、それが電子的になっているかどうかというところが変わってきて。
一段階、研究のベースみたいなものが一段階数十年かけて上がったみたいな感じですかね。
基本露点はだからやっぱり昔から貫くものはあるんじゃないかなというふうに思いますね。
ありがとうございました。貴重なお話をいただきました。家里洋子先生でした。ありがとうございました。
21:02
ありがとうございました。
エンディングです。今日も最後まで放送を聞いていただきましてありがとうございました。
前回に引き続き、京都大学の家里先生との対談ということで、身長を一緒に出させていただいたとはいえ、
そしてこれまでもいろいろな形でお仕事でお付き合いあるとはいえ、
やはり英語史研究の日本における第一人者ということで、家里先生に本当にいつも勉強させていただいているんですが、
今回こうしてヘルディオに対談としてゲストで来ていただいたということ自体が、もうたまらない体験ということで本当に楽しい時間でした。
今日の話題はこの身長ですね。前回この身長の紹介ということでヘルディオお届けしたんですけれども、
2つ目の収録は何かもう少しピンポイントにテーマを絞って、その中でおしゃべりできるといいですねということだったんですが、
なんとなくコーパスといいますか、英語史研究ツールですね、この辺りに注目するのがいいんではないかという流れになりまして、
今回の収録に至ったという次第です。そしてこのコーパスにつきましては、私も研究の初めから大学生、大学院生の頃からコーパスの時代になりかけていましたので、
そちらに関心を寄せまして、そこそこバリバリに使ってきたと、そればかりではないんですけれども、コーパスは使ってきたほうかなと思うんですけれども、
早々期のヘルシンキコーパスという、今日の会で出ましたけれども、第1世代のコーパスから現役で本格的に付き合って来られた家理先生の、
この現代までの数十年間のコーパスの歴史をどうやって整理するかということで、第1、第2、第3世代という切り方、
これはなかなか途中にまたがっていたりして、あるいはきれいにカテゴライズできなかったりするという問題はあって、新書でも書かれています。
この辺りも含めて読んでいただければと思うんですが、ただ概念上は非常に有効な区切りとして、第1、第2、そして第3世代ですね。
第3世代に関しては、これはコーパスというよりもコーパスの使い方という方針、思想みたいなところになっていきますが、それが発展的解消して、
24:01
これが当たり前になっていくのではないかという形で、今回の対談もそうですけれども、そして新書の最終章6章も閉じられているということで、
非常に今後の英語史研究の方向性ですね、占う意味であるいは予期する意味で覚悟しておくべきポイントといいますかね、
これから入っていく時代に用意しておくべきことが明らかにされた、そんな対談になったのではないかなということで、
本当に凝縮した時間ですね、大変贅沢な対談おしゃべりをさせていただいたと思っております。
皆さんもそれぞれご感想とあるかと思いますので、ぜひコメントを寄せていただければと思います。
そして最後にですね、このヘルディオのリスナーの皆さんには、比較的新しく最近になって英語史というものを知って関心を持ったという方も少なくないかと思います。
そして英語史の解説書、入門書というものは日本語でもたくさん出ていますけれども、その中でも最大級に優しいといいますか、入門者を意識した本として、
家入陽子先生の書かれました、ベーシック英語史。2007年に羊書房から出ている本です。
こちら家入先生の代表的著作の一つということですけれども、英語史入門として最も適切な本の一つとなっておりますので、こちらですね、ぜひ参照していただければと思います。
このチャプターにこの本へのリンクを貼っておきますので、ぜひそちらをご覧ください。
このチャンネル、英語の語源が身につくラジオヘルディオでは、あなたからのご質問、ご意見、ご感想をお待ちしています。
Voicのコメント機能を通じてお寄せいただけますと幸いです。
Twitter等でのシェアもお願いいたします。
それでは今日も皆さんにとって良い一日になりますように、ほったりうちがお届けしました。また明日。