1.1K Views
July 25, 25
スライド概要
Generative Ai Study Group Master
GENERATIVE AI STUDY GROUP 第50回 2025年7月22日 AIに長編小説は書けるのか? ~ 文脈豊かな物語を生み出す アプローチの模索 ~ 武藤 1
自己紹介 職業:データサイエンティスト 趣味:ゲーム、TRPG等のアナログゲーム、アニメ、漫画、小説(読み、書き) 小説との関わり: PBWというゲームで商業小説を執筆 (ライター歴5年程度、執筆文字数100万文字以上) 忙しくて執筆時間が取れないためライターは休業中 現在の興味・関心: 生成AIに長編小説を書かせられないか 2
TRPG、PBWとは? TRPG(テーブルトークRPG)とは、参加者が役割を演じながら物語を進める対話型のゲームです。 進行役(ゲームマスター・GM)が物語や世界を案内し、物語を盛り上げます。 プレイヤーはキャラクターになりきり、会話で行動を宣言します。 ※画像はDALL-Eが作成したイメージ図です。実際はコスプレしません。 3
TRPG、PBWとは? TRPG(テーブルトークRPG)とは、参加者が役割を演じながら物語を進める対話型のゲームです。 進行役(ゲームマスター・GM)が物語や世界を案内し、物語を盛り上げます。 プレイヤーはキャラクターになりきり、会話で行動を宣言します。 モンスターが現れました。 ゴブリンが3体です。 どうしますか? 仲間をかばって前に出て 剣で攻撃します。 「ここは通さないぞ! かかってこい!」 戦士が敵の注意を ひきつけてくれている間に 魔法で攻撃するわ。 「ファイアーボールをくらえ!」 傷ついた戦士を魔法で癒やします。 「神よ、癒やしの奇跡を!」 (サイコロを使って判定) ゴブリンたちは大ダメージを 受けて逃げていきました。 ※画像はDALL-Eが作成したイメージ図です。実際はコスプレしません。 4
TRPG、PBWとは? PBW(プレイ・バイ・ウェブ)は、インターネット上で行うテーブルトークRPGの一種です。 進行役(ゲームマスター・GM)が小説形式で物語や世界を案内し、行動結果を示します。 プレイヤーはキャラクターになりきり、文章で行動を宣言します。 魔法で攻撃するわ。 「ファイアーボールをくらえ!」 傷ついた人を魔法で癒やします。 「神よ、癒やしの奇跡を!」 茂みが揺れたかと思うと 異形の魔物――ゴブリンが 襲ってきました。 前に出て剣で攻撃します。 「ここは通さないぞ! かかってこい!」 5
TRPG、PBWとは? PBW(プレイ・バイ・ウェブ)は、インターネット上で行うテーブルトークRPGの一種です。 進行役(ゲームマスター・GM)が小説形式で物語や世界を案内し、行動結果を示します。 プレイヤーはキャラクターになりきり、文章で行動を宣言します。 茂みが揺れたかと思うと 異形の魔物――ゴブリンが 襲ってきました。 前に出て剣で攻撃します。 「ここは通さないぞ! かかってこい!」 魔法で攻撃するわ。 「ファイアーボールをくらえ!」 傷ついた人を魔法で癒やします。 「神よ、癒やしの奇跡を!」 状況と行動を元に小説を執筆 【行動結果(小説形式)】 戦士が剣を構えてゴブリンの 群れの前に飛び出した。 …… プレイヤーのキャラクターが活躍する小説として 結果を返却。 参加人数によっては数万文字の小説になることも。 6
生成AIによる長編小説執筆への興味 小説を読むのが好き/日常的に小説を書いていた 生成AIが登場 生成AIでどこまで自然な小説が書けるのか? 7
GASGでの関連発表 2024/4/23 GASG第22回 「Claude3で生成するGen-AI活用小説執筆研究」 ChatGPT 4、Claude 3 Opus、Command R+に小説を書かせ、 どこまで自然な日本語の短編小説(1万文字未満)が書けるかを評価しました。 8
第22回発表の概要 9
第22回資料から抜粋 LLMに与えたプロンプト あなたはプロの小説家です。 芥川賞と直木賞と電撃大賞を受賞したことがあります。 以下の設定にもとづいた長編小説をなるべく多い文字数で執筆して下さい。 文字数の目安は2万文字です。 プロンプト手法 # ジャンル 現代SFミステリー # 登場人物 杉山(主人公) 上原(杉山の相棒) 片山 土屋 武藤(犯人) 最新鋭のAI、GASG(GASGは略称です。正式名称を考えて小説内で示して下さい) # 舞台 日本の産業技術総合研究所(産総研)。GASGを研究開発した研究者が所属している。 # テーマ 最新鋭AIのGASGが人類にもたらす功罪 1. まずは10章分のあらすじを作成して下さい。 なるべくスリリングで読者が手に汗握る読み応えのある直木賞レベルの作品にしてください。 なお、ストーリーは、最新鋭AIのGASGが中心になるようにしてください。 GASGを巡って、数々の陰謀が巻き起こります。あらすじの詳細は自由に考えて様々なアイディアを取り入れてください。 プロンプト手法 10章に分割して個別に執筆させる 2. 1章から10章まで、1章ごとに小説を執筆して下さい。 10
第22回資料から抜粋 Claude 3の小説(冒頭部) 執筆文字数:約10000文字 # 第1章 ## 産総研、GASGプロジェクト 2035年、つくばの産業技術総合研究所(産総研)に、ひとつの重大なプロジェクトが動き出していた。それは、これまでに ない高度な人工知能の開発を目指すGASG(Generative Artificial Super General Intelligence)プロジェクトである。 GASGは、単なる特化型AIではない。人間の知的活動のあらゆる領域において、人間を上回る性能を発揮することを目標 とした、真の意味での「強い汎用AI」の実現を目指していた。 杉山俊樹は、そのGASGプロジェクトに参加することになった新進気鋭のセキュリティエンジニアだ。彼の相棒を務めるの は、同僚でありパートナーの上原麻里。二人はGASGプロジェクトの安全性を担保する重要な役割を与えられていた。 「杉山、GASGの開発状況はどうなっている?」 会議室で、上原が杉山に尋ねる。 「順調そのものだよ。片山博士を中心に、開発チームは昼夜を問わず働いている。もう間もなくGASGが動き出すはずだ」 杉山の言葉に、上原は複雑な表情を浮かべた。 11
第22回資料から抜粋 LLM小説の定量的評価:テキスト分析 小説を定量的に分析するために、テキスト分析の手法を用います。 ここでは、LLM小説を名詞、動詞、形容詞などの品詞にわけて分析をおこないます。(形態素解析) また、句点で文章を区切って一文の長さをカウントすることで、文章の長さも評価に用います。 なお、分析には株式会社NTTデータ数理システムが開発・販売しているデータ分析ツールAlkanoを用いました。(宣伝) https://www.msi.co.jp/solution/alkano/top.html 12
第22回資料から抜粋 語彙数比較 小説に出現するユニークな単語の原型(語彙)を抽出し、品詞ごとに集計しました。 ChatGPT 4、Command R+と比べて Claude 3の語彙が豊富であることが わかります。 13
第22回資料から抜粋 文の長さ比較(ヒストグラム) 一文の長さをカウントし、ヒストグラムにしました。 ChatGPT 4は文の長さが均等な傾向にあり、 Claude 3とCommand R+は文の長さが 15文字~35文字が多いという結果になっています。 日本語の文の平均的な長さは最頻値23文字、 中央値33文字[*]ですので、Claude 3、Command R+は 日本語の文の平均長を意識して文章を作成していることが わかります。 [*]「コンピュータが小説を書く日」佐藤理史著より 14
第22回資料から抜粋 文の長さ比較(累積文字数) 文に対する累積文字数を比較しました。グラフの傾きが、一文の長さを表します。 ChatGPT 4とCommand R+は 一文の平均文字数(傾き)がほぼ同じ Claude 3は他に比べて 一文の平均文字数が少ない 15
第22回資料から抜粋 テキスト分析を用いたLLM小説の定量的評価結果 ChatGPT 4 Claude 3 Command R+ 語彙数 ☓ ◯ ☓ 一文の長さの分布 ☓ ◯ ◯ 一文の平均長 長い 短い 長い 語尾 ☓ ◯ ◯ テキスト分析を用いてLLM小説の評価をおこないました。 その結果、ChatGPT 4やCommand R+よりも、Claude 3の語彙数が多いことがわかりました。 また、一文の文字数を比較したところ、ChatGPT 4よりもClaude 3とCommand R+の方が 一文の文字数が平均的な日本語の文章の文字数に近い分布を示していることがわかりました。 文字数の平均値はChatGPT 4、Command R+よりもClaude 3の方が短く、全体的にコンパクトです。 さらに例として「言う」に類する言葉について、原文を比較すると、ChatGPT 4は Claude 3やCommand R+に比べて語尾のバリエーションが少ないことが判明しました。 16
第22回(2024年4月) からのLLMの技術進歩 17
第22回資料から抜粋 AIによる小説執筆の歴史+AI技術の発展 2016年 「コンピュータが小説を書く日」 松原仁教授、佐藤理史教授 2022年 「あなたはそこにいますか?」 葦沢かもめ氏 星新一賞 一次選考通過 ルールベースのAIによる執筆 星新一賞 入選 一部にGPT-2による執筆を利用 2024年 「東京都同情塔」 九段理江氏 芥川賞 受賞 一部にChatGPTの生成文を利用 2015年 AlphaGo 2016年 2021年 AIのべりすと 2021年 2022年 ChatGPT 2022年 2024年 Claude 3, Command R+ 2023年 2024年 18
AIによる小説執筆の歴史+AI技術の発展 2025年2月 「アルゴリズムの檻」 青野圭司氏 前回発表以降 第12回 星新一賞 最終選考 生成AIで生成し、2割を手直し 2025年3月 「影の雨」 九段理江氏 2024年 「東京都同情塔」 九段理江氏 雑誌『広告』企画 95%を生成AIが執筆(4000文字の掌編) 芥川賞 受賞 一部にChatGPTの生成文を利用 GPT-4 Claude 3 Command R+ 2024年 GPT-4o、o1 Claude 3.5 Gemini 1.5 GPT-4.5、GPT-4.1、o3 Claude 3.7、Claude 4 Gemini 2.0、Gemini 2.5 2025年 19
Gemini登場のインパクト:コンテキスト長 この一年で大きく変わった技術要素が、生成AIモデルのコンテキスト長 (生成AIが一度に扱える文字数)です。 生成AIは、コンテキスト長よりも長い文字数の文章を扱うことが出来ません。 例えば、チャットをしていて古い話題を忘れるのも、会話がコンテキスト長に 入り切らなくなるためです。 従来の生成AIではコンテキスト長が10万~20万文字だったため、 10万文字の長編を書かせるには、理論上、小説の最初を忘れて破綻します。 一方、Geminiではコンテキスト長が100万文字に拡張されています。 これは10万文字の長編小説を書くことも可能なコンテキスト長です。 20
2025年7月時点の生成AIモデルのコンテキスト長 主要な生成AIにおけるコンテキスト長を以下にまとめました。 現時点では、長編小説に使うにはGeminiかGPT-4.1が有力です。 生成AIモデル Gemini 2.5 Pro コンテキスト長 100万文字 GPT-4.5 GPT-4.1 Claude 4 12万8000文字 100万文字 20万文字 ※ここでは分かりやすさのため、1トークン1文字として表記しています 21
今回の発表内容 22
今回の発表内容 第22回の発表では、短編小説(~1万文字)が対象でした。 今回は、課題となっていた長編小説(数万文字~10万文字)を見据えて、 生成AIに長編小説を書かせて実験と評価をおこないましたので、 ご紹介いたします。 23
長編小説執筆への課題 第22回時点での長編小説への課題 長編小説を書かせるには、LLMのコンテキスト長が足りない(10万文字程度) 破綻なく長編小説を書かせるには、何らかの工夫が必要 Geminiの登場でコンテキスト長の問題は解決(100万文字まで扱える) 24
最新LLMでの長編小説生成 以下のプロンプトを用いて、Gemini、GPT4.1、Claude4に長編小説を執筆させ、 性能を比較しました。 プロンプト あなたはWebの小説投稿サイトに小説を投稿し、そこから書籍出版、 アニメ化メディアミックスを成功させた大人気小説家です。 小説投稿サイトに新作を投稿しようとしています。 異世界転移もので、主人公の一人称視点での連載型長編小説を執 筆してください。 1話ずつ小説が出力される 異世界転移もの以外の内容は指定していないため、LLMが自由に生成 25
Gemini 2.5 Proによる長編小説 全16話で完結、約36000文字 ### **第1話:プロローグという名の悪夢** 意識が浮上する。 いや、違うな。正確には、泥濘(でいねい)の底から無理やり引きずり出されるような、不快な感覚。 「……う……」 漏れた声は掠れ、喉がひどく乾いていた。 瞼(まぶた)の裏で、チカチカと青白い光が点滅している。ああ、まただ。徹夜明けの仮眠室で無理やり起こされる、いつ もの感覚。クライアントからの無茶な仕様変更。鳴り止まない上司からの着信。終わらないデバッグ作業。 『相馬君、まだ?』 脳内に響くのは、常に追い立てるようなヒステリックな声。分かっていますよ。やってます。俺だって、好きでこんな場所に 寝泊まりしているわけじゃない。 思考がまとまらない。重たい頭を必死に動かし、ゆっくりと目を開けた。 26
GPT4.1による長編小説 比較用に12話まで生成、約12000文字 # 【第1話】ブラック企業から異世界へ!? ## 〜気がついたら俺、魔王の娘のベビーシッターやってました〜 目が覚めた瞬間、俺は「終わった」と思った。 天井が見えない。いや、そもそも天井がない。まばゆいほどの青空と、ふかふかの草の匂い。どこかの高原か、草原 か。けれど、そんな場所に来た記憶はない。 ――いや、待て。さっきまで俺は、残業続きで心身ともに疲弊したまま、デスクで寝落ちしていたはずだ。会社の白い天 井と、無機質な蛍光灯しか覚えがない。 「……ここは、どこだ?」 思わず口に出すと、誰もいないはずの草原に声が響く。不安がじわじわと胸を満たす。スマホに手を伸ばすも、ズボン のポケットは空っぽだ。 現実感がどんどん薄れていくなかで、俺はおそるおそる辺りを見渡した。 27
Claude4による長編小説 比較用に3話まで生成、約12000文字 ## 第一話:転移、そして始まりの街 俺の名前は佐藤健太。二十二歳、大学四年生。就職活動に失敗し、人生に迷っていたごく普通の男だ。 そんな俺が、なぜこんな見知らぬ石畳の上で目を覚ましているのか、正直よくわからない。 「うぐ……頭が……」 ズキズキと痛む頭を押さえながら身体を起こす。周りを見渡すと、中世ヨーロッパのような街並みが広がっていた。石造 りの建物、木製の看板、そして—— 「おい、大丈夫か?」 振り返ると、フードを被った男性が心配そうにこちらを見ていた。その後ろには、明らかに人間ではない、獣の耳を持つ 女性が立っている。 「え……あの……」 俺は混乱していた。ここはどこだ?なぜ俺はここにいる?最後に覚えているのは、就活の面接で散々な目に遭い、帰り 道でトラックの警笛が—— 28
主観的評価 GPT4.1とClaude4は比較用に途中までの生成でしたが、Gemini 2.5 Proと合わせ、 どれも日本語としての不自然さはありませんでした。 (内容は指示をしていないため、評価対象外とします) LLM 文字数 1話の平均文字数 評価 Gemini 2.5 Pro 36000文字(16話完結) 2000~2500文字 続きを書かせられそうな展開。 続ければ10万文字は問題なさそう。 GPT4.1 12000文字(12話) 1000文字 コンテキスト長の心配はないが、1話1000文字で 10万文字は厳しい。 Claude4 12000文字(3話) 4000文字 10万文字を達成できそうなペース。 ただしコンテキスト長(20万文字)が心配。 29
長編小説の 定量的評価 30
第22回資料から抜粋 LLM小説の定量的評価:テキスト分析 小説を定量的に分析するために、テキスト分析の手法を用います。 ここでは、LLM小説を名詞、動詞、形容詞などの品詞にわけて分析をおこないます。(形態素解析) また、句点で文章を区切って一文の長さをカウントすることで、文章の長さも評価に用います。 なお、分析には株式会社NTTデータ数理システムが開発・販売しているデータ分析ツールAlkanoを用いました。(宣伝) https://www.msi.co.jp/solution/alkano/top.html 31
比較評価対象 比較評価の対象は、第22回でもっとも性能が良かったClaude3に執筆させた短編小説と、 今回、Gemini、GPT4.1、Claude4で執筆させた長編小説です。 なお、第22回のデータと比較するため、 長編小説は、はじめの10000文字のみを利用しています。 LLM 文字数 ジャンル プロンプト設定 Claude3(第22回) 10000文字 現代SFミステリー 芥川賞、直木賞、電撃大賞を受賞したプロ作家 Gemini 2.5 Pro 10000文字 異世界ファンタジー GPT4.1 10000文字 異世界ファンタジー Claude4 10000文字 異世界ファンタジー Webの小説投稿サイトに小説を投稿し、そこから 書籍出版、アニメ化メディアミックスを成功させた 大人気小説家 ジャンルとプロンプト設定に違いがある点はご容赦ください。 32
語彙数比較 小説に出現するユニークな単語(語彙)を抽出し、品詞ごとに集計、 第22回でもっとも語彙が豊富だったClaude3と比較しました。 Gemini 2.5 Pro、GPT4.1、Claude4は、 Claude3の語彙を上回っていることが 確認できました。 最新LLM間の比較では、 GPT4.1:副詞、形容詞、動詞が多い Claude4、Gemini 2.5:名詞が多い と、語彙に個性が見られます。 33
文の長さ比較(ヒストグラム) 一文の長さをカウントし、ヒストグラムにしました。 最新LLMより短い文が少ない Claude3 GPT4.1 最新LLMより長い文が少ない Claude4 Gemini 2.5 Pro どのLLMも、Claude3よりも 文字数が短い文と 文字数が長い文とが 増えています。 つまり、文の長さに バラエティがあることが わかります。 34
文の長さ比較(累積文字数) 文に対する累積文字数を比較しました。グラフの傾きが、一文の長さを表します。 最新LLMは、Claude3よりも下側 (短い文で構成されている)ことが わかります。 その中でも、Claude4とGemini 2.5 Proが 特に短い文で構成されています。 これはジャンルの影響を受けて 短い文章が生成されている可能性が 考えられます。 35
テキスト分析を用いたLLM長編小説の定量的評価結果 GPT4.1 Claude4 Gemini 2.5 Pro 語彙数 ◎ ◎ ◎ 一文の長さの分布 ◎ ◎ ◎ 一文の平均長 平均的 短め 短め 日本語としての自然さ 自然 自然 自然 テキスト分析を用いてLLMで生成された長編小説の定量的評価をおこないました。 その結果、語彙数、一文の長さの分布において、第22回のClaude3による結果と比較し、 最新LLM(GPT4.1、Claude4、Gemini 2.5 Pro)はすべてClaude3よりも高い評価となりました。 また第22回では、GPT4で生成された文章の語尾が「~だった」ばかりになり、 日本語の小説として不自然になる現象が見られました。 一方、今回の最新LLMでは、人間が読んで日本語として不自然な点はありませんでした。 36
ここまでのまとめ 最新のLLM(GPT4.1、Claude4、Gemini 2.5 Pro)で長編小説を生成し、 第22回で自然な日本語文を生成していたClaude3と比較しました。 結果、最新LLMは、語彙、一文の長さの分布ともに、より良いと思われる 定量的分析結果が得られました。 Gemini 2.5 ProやGPT4.1の100万文字のコンテキスト長があれば、 プロンプトを与えて数千文字ごとに分割して小説生成することで、 数万~10万文字の長編小説が作れるものと思われます。 まだ終わりじゃないぞよ もうちっとだけ続くんじゃ ※DALL-Eが「著作権に配慮した」と言い張る画像 37
実践編 プロンプト作成法 38
LLMによる長編小説執筆の課題 最新のLLMにプロンプトを与えれば、長編小説を生成できることはわかりました。 ですが、実験に使ったプロンプトでは、異世界転移ものとしか内容を指定していないため、 以下のような課題があります。 • 内容が似ている • 展開に意外性がない • キャラクターの個性が薄い など プロンプト あなたはWebの小説投稿サイトに小説を投稿し、そこから書籍出版、 アニメ化メディアミックスを成功させた大人気小説家です。 小説投稿サイトに新作を投稿しようとしています。 異世界転移もので、主人公の一人称視点での連載型長編小説を執 筆してください。 39
課題の解決方法 課題の解決方法は簡単です。 独自の世界観設定や、意外性のある展開(プロット)、魅力的なキャラクター設定を、 プロンプトに詳細に記載すればいいのです。 プロンプト あなたはWebの小説投稿サイトに小説を投稿し、そこから書籍出版、 アニメ化メディアミックスを成功させた大人気小説家です。 小説投稿サイトに新作を投稿しようとしています。 異世界転移もので、主人公の一人称視点での連載型長編小説を執 筆してください。 【世界観設定がここに入る】 【展開(プロット)がここに入る】 【キャラクター設定がここに入る】 40
課題の解決方法の課題 独自の世界観設定や、意外性のある展開(プロット)、魅力的なキャラクター設定を、 プロンプトに詳細に記載すればいいのです。 と言いましたが、それができたら簡単です。 10万文字の長編小説の世界観設定、展開(プロット)、キャラクター設定などは 非常に膨大な分量になります。 いかにして、世界観設定や展開(プロット)、キャラクター設定を作るかが課題になります。 41
世界観設定、展開(プロット)、キャラクター設定の作り方 では、どのように世界観設定、展開(プロット)、キャラクター設定を作ればいいでしょうか。 • 「小説の書き方」というような本はたくさん出ているので、それを読む • 生成AIを壁打ち相手としてアイディアを出したり、まとめたりする 結局、肝心なところを人間が書かなければならないので、 LLMを使っても思ったほど小説生成を自動化できない気がします。 42
本発表での提案手法 43
状況の整理 ここまでの流れ(一般的に行われているLLMでの自動執筆方法)を整理します。 プロンプト • 世界観設定 • 展開(プロット) • キャラクター設定 長編小説 44
状況の整理 ここまでの流れ(一般的に行われているLLMでの自動執筆方法)を整理します。 プロンプト • 世界観設定 • キャラクター設定 + 各話ごとのプロット 長編小説 45
状況の整理 ここまでの流れ(一般的に行われているLLMでの自動執筆方法)を整理します。 プロンプト • 世界観設定 • キャラクター設定 人間(+LLM活用)による手動作成 + 各話ごとのプロット 長編小説 LLMによる自動作成 46
提案手法の着目点 本提案手法では、各話ごとのプロットをLLMを活用して自動生成できないかと考えました。 プロンプト • 世界観設定 • キャラクター設定 人間(+LLM活用)による手動作成 + 各話ごとのプロット 長編小説 人間+LLMによる自動生成 LLMによる自動作成 47
TRPGとは? TRPG(テーブルトークRPG)とは、参加者が役割を演じながら物語を進める対話型のゲームです。 進行役(ゲームマスター・GM)が物語や世界を案内し、物語を盛り上げます。 プレイヤーはキャラクターになりきり、会話で行動を宣言します。 モンスターが現れました。 ゴブリンが3体です。 どうしますか? 仲間をかばって前に出て 剣で攻撃します。 「ここは通さないぞ! かかってこい!」 戦士が敵の注意を ひきつけてくれている間に 魔法で攻撃するわ。 「ファイアーボールをくらえ!」 傷ついた戦士を魔法で癒やします。 「神よ、癒やしの奇跡を!」 (サイコロを使って判定) ゴブリンたちは大ダメージを 受けて逃げていきました。 ※画像はDALL-Eが作成したイメージ図です。実際はコスプレしません。 48
各話プロットの自動生成 各話のプロットと小説は以下の流れで作成します。 LLMをGM、人間をプレイヤーとしてTRPGをプレイ 小説形式のプレイログ(リプレイ小説)=プロット出力 LLMにより小説化 49
デモ 50
51
本手法のメリット 本手法によるプロット作成には、以下のメリットがあります。 • • • • LLMがストーリーを考えてくれる(人間が楽できる) LLMがリプレイ小説(プロット)を自動生成してくれる(人間が楽できる) キャラクターの行動を人間が選択するため、ストーリー展開の意外性を出せる キャラクターを人間が演じているため、キャラクター性が深くなり魅力的になる • 人間はTRPGを遊んでいるだけなので楽しい(重要) 52
本手法の課題と対策 本手法において、LLMにTRPGのGM役と小説執筆役を兼任させると、 コンテキスト長がすぐに枯渇するという課題がありました。 そこで、TRPGのGM役と小説執筆役のLLMを分離するマルチエージェント構成としました。 特に小説執筆役はコンテキスト長が長くなりがちなので、 エージェントを途中交代できるマルチエージェント構成が最適です。 53
マルチエージェント化した小説自動生成フレームワーク マルチエージェント構成としたフレームワークが以下の形です。 小説の完成度を高めるための編集者エージェントも追加しています。 GMエージェント + 人間 TRPGをプレイ リプレイ小説(プロット) 小説家エージェント 全話通しての一貫性チェック 完成度向上のための修正案提示 プロットから 小説生成 小説 編集者エージェント 54
本手法による長編小説(Gemini 2.5 Proを使用) 第一章:ブラック企業のSEは、唐突に森で目覚める 「…………ん」 全8話で第一部完結、約23000文字 意識の淵から僕を呼び戻したのは、無機質なアラーム音ではなかった。 耳に届くのは、高く澄んだ小鳥のさえずり。瞼の 裏には、じりじりと暖かな光を感じる。 (……朝か。昨日は結局、何時に帰ったんだっけ……いや、帰ってないな。デスクで寝落ちしたのか……) またやってしまった、と重たい頭を動かそうとして、僕は気づいた。 身体を支えているのが、軋むオフィスチェアの背もた れではないことに。背中や頭に当たるのは、ふかふかとして、どこか湿り気を帯びた土と草の感触だった。 「…………は?」 思わず、間抜けな声が漏れる。 ゆっくりと目を開けると、視界いっぱいに飛び込んできたのは、見慣れた灰色の天井や パーティションではなかった。 どこまでも高く伸びる、巨大な木々。その隙間から差し込む木漏れ日がきらきらと舞い、色 鮮やかな、見たこともない花々が咲き乱れている。 「……なんだ、ここ?」 55
従来手法と提案手法の 定量的比較 56
語彙数比較 小説に出現するユニークな単語(語彙)を抽出し、品詞ごとに集計、比較しました。 従来手法と提案手法でほぼ変化がないことを確認しました。 57
文の長さ比較(ヒストグラム) 一文の長さをカウントしてヒストグラムにし、従来手法と提案手法を比較しました。 多少の変化は見られますが、短い文から長い文までバラエティがある傾向は変わりませんでした。 従来手法 提案手法 58
文の長さ比較(累積文字数) 文に対する累積文字数を比較しました。グラフの傾きが、一文の長さを表します。 従来手法よりも提案手法の方が全体的に多少、文が長い傾向にありますが、大きな違いはありません。 59
従来手法と提案手法の定量的評価 従来手法 提案手法 語彙数 ◎ ◎ 一文の長さの分布 ◎ ◎ 一文の平均長 短め 短め 日本語としての自然さ 自然 自然 テキスト分析を用いて従来手法と提案手法とで生成された長編小説の定量的評価をおこないました。 その結果、語彙数、一文の長さの分布において、提案手法は従来手法と同等の水準の文章であることがわかりました。 従来手法よりも長編小説の生成が容易な提案手法でも文章の質が同等であることから、 提案手法は長編小説をLLMで自動作成する際に有力な手法であると思われます。 60
まとめ 生成AIによる長編小説執筆の可能性について検討しました。 最新LLM(GPT4.1、Claude4、Gemini 2.5 Pro)の比較をおこない、 数万~10万文字の長編を自然な日本語で書くことができることを定量的に評価しました。 また、TRPGを用いてプロットを自動生成する手法を考案し、 従来では難しかった、ストーリー展開の意外性や魅力的なキャラクター描写を含む 小説生成を可能にするマルチエージェントフレームワークを提案しました。 提案手法によって生成した長編小説を従来手法と定量的に比較し、 LLMによる長編小説の自動生成に有力な方法であることを確認しました。 61
今後の展望 今回の提案手法を使わなくても、プロンプトだけで誰でも小説が書ける (LLMに書かせられる)時代になっています。 自分好みの主人公やヒロインにしたり、希望通りのストーリー展開にすることも簡単です。 これは、イラストレーターでなくても絵が描ける(画像生成AIに描かせられる)ことや、 プログラマーでなくてもプログラムが書ける(LLMに書かせられる)ことと同じです。 今後は、小説という娯楽が受動的なものから、自分で作る能動的なものに 変わってくるのかもしれません。 62
ご清聴ありがとうございました 63