コンテンツにスキップ

言語研究とAI

新しい「相棒」の登場

ChatGPTに聞けば、レポートなんて一瞬で書けるんじゃない?」

大規模言語モデル(Large Language Models、LLM)が私たちの日常に浸透しつつある2025年10月現在、一度はこのように考えたことがあるかもしれません(以下、単にAI)。確かに、AIは驚くほど流暢で、博識に見える文章を生成してくれます。

これまでの言語研究では、研究者は「探偵」のような存在でした。自らの言葉のアンテナを頼りに、言葉の謎を見つけ、「内省」という虫眼鏡で覗き込み、コーパスという膨大な証拠リストを精査する。地道ですが、知的な興奮に満ちた仕事です。

2022年の末頃、その探偵事務所に一人の新人アシスタントが配属されました。それがAIです。彼は超優秀で、世界中の文献を(ある意味で)読破しており、どんな質問にも即座に答えてくれます。しかし、彼には一つだけ困ったクセがあります。それは、わからないことがあると、それらしいウソをを自信満々にでっち上げてしまうことです。

この章では、この「超優秀だけど、たまにウソをつく新人アシスタント」とどう付き合い、彼を最高の「研究パートナー」に育て上げるか、そのための「対話術」を学んでいきます。AIは、私たちの知的な冒険を、これまで以上に刺激的なものにしてくれる新しい相棒になってくれるでしょう。

この章で学ぶこと

  • AIの限界(特にハルシネーション)を理解し、回答を鵜呑みにしない癖を身につける。
  • AIを「発想の壁打ち相手」や「作業のアシスタント」として活用する具体的な方法を学ぶ。

人間もAIもウソを言う

AIの特徴の一つとして、ありもしない事実をそれっぽく語る点があります。学生がAIを使うとき、一番懸念されるのは、何といってもこのようなAIの特徴、つまりハルシネーション(hallucination、幻覚)です。

韓国の食べ物

「ミルミョン」と「トンネパジョン」が何なのかは後で見ることにして、「虚言症強めのAI」に、以下の質問をしてみましょう。

プロンプト
「ミルミョン」と「トンネパジョン」について教えて

主張を裏付ける証拠

レポートや論文で、主張を裏付けるために「ChatGPTによると…」と書くのは、学術の世界では「噂話では…」「都市伝説によると…」「どこの馬の骨かわからないやつが書いたブログによると…」と書くのと同じです(むろん、2035年くらいになると、このような心配はしなくてもいいかもしれません)。必ず自分の目で確かめる必要があります。証拠となるものの信憑性が低いと、それを土台とした自分の主張の信憑性もあやふやになります。

AIは研究の「敵」か「味方」か?

いつもよりまして、男女・世代・政治、そして気候まで、二極化が著しい世界になりつつあるような気がします。そのように考えていたことも関係があると思いますが、2025年2月、韓国に行ったときに「中庸を守る姿勢を持ちたい」と思って、古典として有名な『菜根譚』を買いました。煩悩を捨てるためにも役に立ちます。

できる限り、中立的な立場から物事を考えたい私は、AIについても、そのような考え方を持っています。今現在のAIは、使い方によって、私たちの思考を停止させるような「毒」になったり、今までは想像の範囲で留まっていた私たちの考えを、実現させてくれる相手にもなったりします。どうにかして、AIのいい側面を最大限に活用していきたい。そのためには、中庸を守る必要があります。

AIの登場で、言語学の知見がAIの発展を支えてきた歴史は、新しい段階に入りました。これまでのAIが、主に文の構造を解析する「分析ツール」だったのに対し、現在のAIは、自ら文章を生成することができます。これにより、AIは私たちの研究において、2つの新しい役割を担うことができるようになりました。

発想を広げる「対話相手」

韓国の文化に詳しい人でも、韓国の地方で有名な食べ物についての知識は持っていない可能性があります。ましてや、韓国に興味のない人に「『ミルミョン』と『トンネパジョン』、どっちが好き?」と聞いても、相手は何を言っているのか、その意味がわからないでしょう。こういうときに、世界中の料理についての知識を持っているAIが、隣で色々と教えてくれるとしたら、何となく料理の味を想像し、好き嫌いが言えるようになるでしょう。でも、その想像にだけ頼った味が、本場で食べる本物の味だと言えるのでしょうか。思ったのと全然違う味かもしれません。

さて、「言語学」という専門分野の話に戻って、「『形態論』と『語用論』、どっちが好き?」と言われても、そもそも知識がないのであれば、答えることはできません。今回も同じく、言語学についてのあらゆる知識を知っている物知りAIが、親身になって基礎から教えてくれると思ってみましょう。何となく二つの分野についての知識を得て、好き嫌いが選べるようになるでしょう。今回も、AIを頼りに学習した知識が、100%正確な知識だとは言い切れないかもしれません。でも、2025年現在、「AIが言っているのは100%ウソだ!」とも言えないようなところまで、AIの知識は発達しています。下手をすると、Googleのような検索エンジンから検索をして訪れたいくつかのウェブサイトにある情報よりも正確かもしれません。

AIのいいところの一つとして、利用者の発想を広げてくれる「対話相手」の役割をする点が挙げられます。この発想の段階では、AIによる情報が80%くらい正確で、20%程度は不正確でもいいでしょう。何もわからない0%の状態にいるよりは、80%くらいでも情報を持っている(わかっている)状態の方がマシです。さらに多くの情報に接して学習をしつづけると、不正確な20%の情報が、確かな情報として修正されていくからです。勉強や知識を得るメカニズムも、そのような過程を経ることで、まともな知識として定着するようになります。学習にそのような過程がないのであれば、誰も苦労などしません。

何も専門知識がない状態で一日中「『ミルミョン』っていったい何だろう」と妄想を広げるよりも、やや不正確であっても、それがどういうものなのかについて、少しでも知識を持つようになった方がいい。色んな方向へと発想を広げてくれる対話相手として、現代のAIはすぐれものです。

複数の媒体による情報収集

世の中の知識がすべて、ウェブ上にアップロードされているわけではありません。特に人文学の場合は、デジタル化されていない知識が、図書館や資料室などで眠ったままの状態でいるかもしれません。「読書離れ」とも言われる時代になっていますが、紙媒体に触れることが今現在でも重要なことは言うまでもないでしょう。紙媒体の本でも印刷費用がもったいないと思うようなものもあれば、ウェブ上のブログ記事でも、非常に多くの洞察をもたらしてくれるものもある。一方に偏るのではなく、どちらにも触れてみる必要があります。

作業を効率化する「アシスタント」

AIは、面倒なデータの整理や、文章の要約といった作業を肩代わりしてくれます。

ここでも「中庸」のことを再び思い出して、「何から何まで、文章は全部要約して読む!」ではなく、要約された文章を読んで、自分の問題解決の重要な鍵になるような読み物であれば、じっくりと時間をかけて読む必要があります。そもそも論文に、「要旨(abstract)」というものが付いていますよね。

「じっくりと時間をかけて読む」ときも、AIは立派なアシスタントの役割をしてくれます。よくわからない専門用語の解説をしたり、類例を作って見せたりすることができます。

専門用語理解のためのAIの活用

以下のいずれかのAIにアクセスしてみましょう。いずれも無料・Googleのアカウントを利用して使うことができます。

「コーパス」について学ぶとき、「コロケーション」という専門用語がよく登場します。以下のプロンプトを使ってAIに聞いてみましょう。

プロンプト
言語学における「コロケーション」とは?
日本語の具体例を3つ挙げて、初心者にもわかりやすく説明しなさい。

コロケーションについて、書籍ではどのように説明しているのでしょうか。

  • 「…語と語のより自然な結びつきをコロケーション…」(堀 2011)1
  • 「…慣習的に結びつく語、つまりコロケーション…」(斎藤 et al. 2015)2
  • 「本章では、主に単語と単語の共起を扱ってきました。コーパス言語学などの分野では、このような単語と単語の結びつきをコロケーションといいます。」(小林 2019)3
  • 「…コロケーション(collocation)」がある。これは、ある程度の強さを持った語と語の結び付き、よく使われる語と語の組み合わせのことを指す。」(丸山 et al. 2025)4

少納言を利用して、AIがコロケーションの例として示した例の実際を検索してみましょう。コーパスの中には、不自然なコロケーション(組み合わせ)の例が一つもないのでしょうか。あるとしたら、それはなぜでしょうか。

以下のメモ帳に、AIの説明によって「理解が深まった点」や「不正確だと思われる部分」、「複数の媒体による情報収集」や「気づいた点」などについて書いてみましょう。

「AIが言っているのがウソではないという保証はあるのか?」と心配になる人は、上で話した「ミルミョン」と「トンネパジョン」の話と「複数の媒体による情報収集」のことを思い出しましょう。素早く概念を自分の頭に形成させておいて、他の人の意見も聞いたり読んだりしたうえで、最終的に自分の知識として頭に定着させるようにしましょう。

AIに「対話相手」、あるいは、「アシスタント」のどちらの役割で協力してもらうにせよ、最終的な判断を下して、その内容に責任を持つのは、リーダーである「あなた(人間)」自身です。「AIが言ってました」というのは、責任逃れにしかなりません。

AIと対話して「ネタ」を見つける

研究の第一歩は、面白い「問い」を見つけることです。しかし、いい問いはそう簡単には思いつきません。そんなとき、AIは最高の壁打ち相手になってくれます。

AIとブレーンストーミング

自分の「言葉のアンテナ」が捉えた漠然とした関心を、具体的な研究仮説へと発展させてみましょう。

あなたが少し気になっている言葉や表現について、AIに尋ねてみましょう。

プロンプト
日本の大学生のレポート作成アシスタントとして、
接客の場面で聞くことがある「バイト敬語」について、
言語学的に分析できそうな面白い視点を5つ提案してください。

提案された視点の中から一番面白そうなものを選び、さらに深掘りしてみましょう。

プロンプト
「心理言語学(過剰修正)からの視点」が面白そうです。
具体的に、どのような研究仮説が立てられますか?検証可能な形で3つ提案してください。

AIの回答の中には、一人でずっと考えていても思いつかないような言及もあります。もし、現在のようなAIがなかったとしたら、みなさんはまずウェブ検索で情報を集めるのではないでしょうか。もし、ウェブ検索のような技術がなかったとしたら、自然と紙媒体の文献、あるいは、友達や教員に聞いて、色々なアイデアを得ることになるでしょう。

ここでもう一度、「中庸」のことを思い出し、一方にだけ頼らないようにしましょう。もはや「大学の教員が間違っていることを言うわけがない」と信じている人はいないと思いますが、教員も人間なので、必ず正確なことだけを言うとは限りません。うろ覚えの情報をぼんやりと伝えることもあるし、ときには(教員自身は正確だと思い込み)不正確な情報を伝える可能性もあります。

また、AIの回答には、見たことのない専門用語がずらりと出てきます。その中にある用語についてもまた、AIに聞いてみるといいでしょう。ただし、「複数の信頼できる情報に触れる」ことを忘れないように。

Deep Research

「この素晴らしいアイデアは、まだ誰も思いついていないはず!」

なかなかそういうことはありません。まったく同じアイデアではないかもしれませんが、あなたが考えたアイデアと似たようなアイデアを数年や数十年前に思いついて、研究している可能性は、それなりに高いです。なので、みなさんの素晴らしいアイデアと関連している研究はないのか、膨大な量の研究、文献を調べる必要があります。この段階で使えるのが、Deep Researchという機能です。

Deep Researchは、特定のトピックについて、ウェブ上でアクセス可能な複数の情報源を網羅的に調査し、長文の構造化されたレポートを生成する機能です。どのような情報に基づいているのか、情報源のURLも明示してくれます。

Deep Researchの効果的な使い方

Deep Researchを最大限に活用するために、以下の点を覚えておきましょう。

✅ Do(やるべきこと)

  • 調査の「方向性」を掴むために使う
  • どんなキーワードで調査すべきかのヒントを得る
  • 見落としていた研究の視点を発見する
  • 英語で書かれた先行研究を効率的に探す

❌ Don't(避けるべきこと)

  • AIの要約を鵜呑みにする
  • 情報源を確認せずにレポートや卒業論文に引用する
  • Deep Researchだけで調査を完結させる
  • 生成されたレポートをそのままコピペして提出する

Deep Researchという機能は、ChatGPTやGemini、Claudeなど、それぞれのモデルで呼び方が少しずつ違います。ここでは、GoogleのDeep Researchを使ってみることにしましょう。

Deep Researchを使ってみよう

あなたの「言葉のアンテナ」が捉えた(たとえば以下のような)疑問を、なるべく具体的に書いて、送信してみましょう。

  • 日本語の「ヤバい」の意味変化について、どんな先行研究があるか?
  • 若者言葉の研究方法として、どのようなアプローチが有効か?
  • コーパス言語学におけるコロケーション分析の最新動向は?

しばらく待つと、AIが考えた計画が表示されます。自分が意図した計画と合致しているのかを確認し、「計画を編集」、または、「リサーチを開始」します。

AIが生成したレポートを読みながら、以下の点についてチェックをしてみましょう。

  • 情報源は信頼できるか?(学術論文、大学のサイト、公的機関など)
  • 情報源のリンクは有効か?(実際にクリックして確認)
  • 複数の視点が含まれているか?
  • 最新の情報が含まれているか?
  • 具体的なデータや事例が示されているか?
  • 矛盾する情報はないか?

Deep Researchの限界を理解する

Deep Researchは強力で、予備調査の出発点としてはいいですが、限界もあります。

  1. 最新情報の制約

    • 検索エンジンがインデックスしていない情報は見つからない。
    • 出版されたばかりの研究は含まれていない可能性がある。
  2. 有料データベースへのアクセス不可

    • 学術論文の全文(有料)には通常アクセスできない。
    • 新聞記事データベースなどの有料サービスも利用できない。
  3. 情報の選択バイアス

    • AIが「重要」と判断した情報が選ばれるが、その判断が常に正しいとは限らない。

最終的には自分で原典を確認したり、図書館のデータベースや紙媒体の文献も活用することが不可欠です。


  1. 堀正広(2011)『例題で学ぶ英語コロケーション』研究社. 

  2. 斎藤純男・田口善久・西村義樹(2015)『明解言語学辞典』三省堂. 

  3. 小林雄一郎(2019)『ことばのデータサイエンス』朝倉書店. 

  4. 丸山岳彦・佐野真一郎・茂木俊伸・et al.(2025)『日本語の文法・音声』朝倉書店.