Corpus of Contemporary American English (COCA)の使い方を毎回忘れるので、以下まとめておきます。併せて、COCAを無料で使用する時に注意が必要な点も、実体験を踏まえて記しておきます。
COCAとは
https://www.english-corpora.org/coca/
COCAの使用で注意したい点
注意点
- 短時間で大量のアクセスには注意する
- アカウント登録は無料利用でも必須
まず1についてですが、同じグローバスipアドレスからのアクセスは24時間で200クエリ(回)という制限があります。
そのため、学校などのwifiを大勢で接続してアクセスするとそれだけで接続ができなくなります。
実際、学校のwifiに接続をしてCOCAを使用していたところ、30名ほどの講義だったため数分でアクセス制限がかかってしまい、みんなアクセスすることができなくなってしまいました。
アクセス制限の時の対処法
アクセス制限の時の対処法
・違うwifiに接続する
・スマホからアクセスやテザリング機能等を使用する
・ポケットwifiなどを利用する
・VPNなどを利用して、ipアドレスを変更する
試行回数の超過によるアクセス制限への対処方としては、上記の方法が考えられます。特に最後はEdgeが1GBまでのVPN機能を実装したとの報道があったので、以前より利用しやすいのかなと思います。
学内の違うwifiに接続しても、回線事体は同じであることがあるので「確認くん」などでグローバルipを確認してみるといいでしょう。
2についてですが、会員登録 (Register) は絶対に必須です。使いにくいサイトですが、頑張って登録をしましょう。
登録をすると、そのアカウントに50件までの検索利用枠が付与されます。この検索枠はブラウザの再読み込み(リフレッシュ)などでもカウントされていきますので要注意です。
とくにCOCAは検索から結果表示までが遅いので、辛抱強く待つことが大切です。
(実際に私は再読み込みを連発してしまい、利用枠をあっという間に消費してしまいました。)
COCAの使い方
汎用コーパス COCAの使用法
English Corpora.orgを用いた言語データの採取(おすすめ)
ECO-Tutorial.pdf (yohasebe.com)
COCA の使用方法について
COCAの検索方法
COCAでは、以下の方式で検索をすることができるらしい。
- ワイルドカード(UCREL CLAWS 7のタグセット) 上記の方式でのタグセットを[ ]の中に用いて、検索が可能 UCREL CLAWS7 Tagset
- POS :上記のワイルドカードをドロップダウンリストから選択して、簡単に行える
ワイルドカード・タグ・品詞指定の方法(抜粋)
以下は、よく使いそうな検索例を上記の論文から抜粋したものです。