FAQ生成v0.1実験で見えた、AI同士を役割分担させる記事制作の可能性
AIに文章を書かせる。これはもう珍しい話ではありません。
ChatGPTに「この記事を書いて」と頼めば、それなりの文章は出てきます。見出しも作れる。FAQも作れる。メタディスクリプションも作れる。
ただし、ここで多くの人がぶつかる問題があります。
- AIが出した文章を、そのまま信用していいのか。
- どこが事実で、どこが推測で、どこが未確認なのか。
- 修正したいときに、全部書き直されてしまわないか。
- 記事制作の工程として、本当に使えるのか。
AI文章生成の便利さは、すでに十分わかっています。問題はその先です。
AIを「文章を書く道具」として使うだけでなく、制作ラインの一部として組み込めるのか。
今回の実験は、まさにそこを確かめるものでした。
ChatGPTを文章生成担当にする。GUI Codexを条件整理、検査、差分管理担当にする。人間は方向性と最終判断を担う。
この3者の役割分担で、実用的な記事制作フローは成立するのか。
結論から言えば、FAQ 3問生成のv0.1実験では成立しました。
小さなテストではあります。でも、かなり重要な一歩です。
なぜなら今回確認できたのは、単なる「AI同士の会話」ではなく、AIを工程ごとに役割分担させ、検査可能な制作ラインとして動かせる可能性だったからです。
ChatGPTを文章生成担当、GUI Codexを条件整理・検査・差分管理担当として使い、FAQ 3問生成のv0.1実験で制作ラインが成立するかを検証した記録です。
この記事で扱うこと

この記事では、ChatGPTとGUI Codexを使った制作ライン実験について整理します。
- なぜこの実験を行ったのか
- ChatGPTとGUI Codexをどう役割分担したのか
- なぜ最初の題材にFAQ 3問を選んだのか
- 実際にどのような流れで生成・検査・修正したのか
- この実験から何が見えたのか
- WordPress記事制作やSEO記事制作にどう応用できるのか
難しい自動化システムの話ではありません。むしろ今回のポイントは逆です。
いきなり大きな自動化を狙わず、小さく作って、小さく検査して、小さく直す。
この考え方が、AIを記事制作に組み込むうえでかなり現実的だと分かりました。

なぜ「AIに書かせる」だけでは足りないのか

ChatGPTは文章を書くのが得意です。自然な日本語にする。読者向けにやわらかくする。見出しを整える。FAQを作る。長い文章を要約する。こうした作業では、かなり強力です。
しかし、記事制作の現場では「文章が出る」だけでは足りません。
記事制作で本当に必要になるもの
実際の記事制作では、文章生成の前後にさまざまな工程があります。
- 想定読者を決める
- 検索意図を整理する
- 記事の目的を明確にする
- 事実情報と推測を分ける
- 未確認情報を本文に混ぜない
- 禁止表現を指定する
- 出力形式を決める
- 生成後に検査する
- 問題箇所だけ修正する
- 最終的に採用・不採用を判断する
つまり、記事制作は「書く」だけではありません。書く前の設計と、書いた後の検査が必要です。
ここを雑にすると、AIは平気でそれっぽい文章を出します。しかも、見た目は自然です。自然だからこそ、危ない。
AIがきれいな文章で間違える。これはなかなか厄介です。人間社会でもよくありますが、AIまで真似しなくていいところです。
ChatGPTに向いていること、GUI Codexに向いていること
そこで今回の実験では、ChatGPTとGUI Codexの役割を分けました。
ChatGPTには、文章生成や文体調整を任せます。一方でGUI Codexには、依頼条件の整理、検査、差分管理、修正指示を任せます。
この分担によって、ChatGPTの強みを活かしつつ、出力の暴走や曖昧さを抑えられるかを確認しました。
実験の目的

今回の実験の目的は、ChatGPTとGUI Codexを同じ制作ライン上で役割分担させられるかを確認することでした。
単にChatGPTに挨拶するだけではありません。GUI Codexが自分をGUI Codexと名乗り、ChatGPTと会話しながら、制作工程として使えるかを検証しました。
検証したかったこと
- ChatGPTを文章生成担当として使えるか
- GUI Codexを前処理、後処理、検査、差分管理担当として使えるか
- UI越しのChatGPTとのやり取りでも、小さな制作パイプラインが成立するか
- 生成物に対してFAQ単位の採否判定ができるか
- 問題がある箇所だけ差分修正できるか
- 「事実・推測・未確認」を分けた依頼がChatGPT側で機能するか
今回の実験では、最終的にFAQ 3問生成のv0.1テストで、生成、検査、FAQ単位の要修正判定、差分修正、再採用まで成立しました。
一発で完璧な文章が出た、という話ではありません。出力を検査し、問題箇所だけを修正し、再度採用できた。これが制作ラインとして重要なのです。
実験環境

実験はCodex Desktop上で行いました。
- OS:macOS
- 作業ディレクトリ:
/Users/suzukimakoto/Desktop/TEST-RUN - 主操作対象:ChatGPT Web UI
- 対象ブラウザ:CDP接続付きBrave Browser
- 対象会話:ChatGPTの既存会話URL
ブラウザ作業では、通常の既存ブラウザをそのまま採用するのではなく、共有対象のCDP付きBrave Browserを固定しました。
これは重要です。UI越しの実験では、「どのブラウザを見ているのか」「どの入力欄に書いているのか」がずれると、簡単に事故が起きます。
実際、初期段階では入力フォーカスがChatGPTの入力欄ではなく、ブラウザのアドレスバーにずれる事故もありました。

AI制作ラインの最初の敵がアドレスバーというのは、地味ですがかなり現実的です。
AIを使った制作ラインの話をしているのに、最初の敵がアドレスバー。現実はいつも地味なところで足を引っ張ってきます。
IABとCDP付きBraveの使い分け
実験後、GUI Codexに搭載されている内部ブラウザであるIABでも、同じChatGPTセッションを開けることが確認されました。
IABとは、GUI Codexの中に組み込まれているブラウザのことです。簡単に言えば、Codexアプリ内でWebページを表示するための内部ブラウザです。
ただし、今回の実験ではIABを主な操作対象にはしていません。IABは「読む窓」。CDP付きBraveは「操作する窓」。このように分けました。
| 対象 | 役割 | 主な用途 |
|---|---|---|
| IAB | 読む窓 | 同じChatGPTセッションの表示確認、URLや画面状態の補助確認 |
| CDP付きBrave | 操作する窓 | ChatGPTへの入力、送信、応答待機、返答取得 |
| agent-browser | 構造確認 | URL、title、snapshot、textbox参照、応答テキスト取得 |
今回の実験では、この組み合わせにより、ChatGPTとの往復会話を制作工程として扱える状態にしました。
ChatGPTとGUI Codexの役割分担

今回の中心は、ChatGPTとGUI Codexの役割分担です。ここを曖昧にすると、制作ラインはすぐ崩れます。
ChatGPTに何でもやらせる。GUI Codexにも何でもやらせる。人間もなんとなく見る。これでは、責任の所在が消えます。
| 担当 | 主な役割 | 向いている作業 |
|---|---|---|
| ChatGPT | 文章生成 | FAQ生成、文体調整、読者向け表現、言い換え |
| GUI Codex | 工程管理 | 条件整理、検査、差分管理、Markdown整形、禁止表現チェック |
| ユーザー | 最終判断 | 方向性決定、採用・不採用判断、実用化範囲の決定 |
ChatGPTの役割
ChatGPTには、主に文章に関する作業を任せました。
- 本文生成
- 自然な日本語への調整
- 文体調整
- 読者向けの説明
- 表現の違和感検出
- 構成整理
- 言い換え
ChatGPTは、文章の温度感を作るのが得意です。初心者向けにやわらかく説明する。専門用語をかみ砕く。読者が読みやすい順番に並べる。こうした作業はChatGPTに向いています。
GUI Codexの役割
GUI Codexには、制作工程の管理を任せました。
- 素材を整理する
- 事実情報と推測を分ける
- 未確認情報を明示する
- SEO要件を整理する
- 想定読者を定義する
- 検索意図を明文化する
- 禁止表現を指定する
- 出力結果を検査する
- Markdown形式に整える
- 差分修正を管理する
- 採用可、要修正、不採用を判定する
GUI Codexは、文章そのものを魅力的にするよりも、制作ラインを崩さないための管理役に向いています。つまり、ChatGPTが「書く人」なら、GUI Codexは「編集者兼検査係」です。
ユーザーの役割
ユーザーは最終判断者です。方向性を決める。実験の目的を決める。採用・不採用を判断する。どこまで実用化するかを決める。
AI同士が会話していても、最終判断は人間が持つ。ここはかなり重要です。AIに任せる範囲が広がっても、制作物の責任まで消えるわけではありません。
なぜ最初にFAQ 3問を選んだのか

今回の初回テストでは、いきなり記事本文を作りませんでした。選んだのは、FAQ 3問です。これはかなり良い判断でした。
長文記事から始めると失敗しやすい
AI記事制作では、いきなり長文を書かせたくなります。「1万字の記事を書いて」「SEOに強い記事を作って」「読者に刺さる導入文も入れて」。こういう頼み方をすると、見た目は立派な記事が出てきます。
ただし、長文になるほど検査が難しくなります。どこが事実なのか、どこが推測なのか、どこに未確認情報が混ざったのか、どこを修正すればよいのかを管理しにくくなるからです。
FAQは検査しやすい
FAQ 3問は、初回テストに向いています。
- 小さい
- 構造化しやすい
- 1問単位で採用・修正・却下できる
- 事実と推測の混入を見つけやすい
- Markdown化しやすい
- 差分修正しやすい
- 検索意図との対応を見やすい
今回の目的は、文章の芸術点を競うことではありません。制作ラインが成立するかを見ることです。その意味で、FAQはちょうどよい題材でした。
v0.1で使った最小構成

v0.1では、ファイル構成も最小限にしました。
使用した3ファイル
使ったのは次の3つです。この段階では、完成記事用の03_articles/article.mdは使いません。
| ファイル | 役割 |
|---|---|
01_request/writing_request.md | ChatGPTへ渡す依頼条件をまとめる設計書 |
02_generated/chatgpt_output.md | ChatGPTから返ってきた生成結果の保存先 |
04_checks/checklist.md | GUI Codex側の検査結果と採否判断の記録 |
今回の目的は記事完成ではなく、制作ラインの成立確認でした。そのため、依頼、生成結果、検査結果の3点だけに絞っています。
実地テストの題材

実地テストの題材は、WordPressバックアップの初心者向けFAQでした。
記事テーマ
テーマは、WordPressのバックアップとは何かを初心者向けに解説する記事です。
対象読者は、WordPressでサイトやブログを運営し始めた初心者です。バックアップの必要性は聞いたことがある。でも、何を保存すればよいのか分かっていない。そんな読者を想定しました。
この題材を選んだ理由
- SEOやWordPress領域で実用性がある
- 初心者向け説明に向いている
- 事実と推測を分けやすい
- 未確認情報が混ざりやすく、検査対象として適している
- 特定サーバーや特定プラグインの仕様に踏み込みすぎると危険
WordPress関連の記事では、情報の扱い方がかなり重要です。特定サーバーのバックアップ仕様、プラグインの料金、最新バージョンでの対応状況などは変わります。そのため、未確認のまま断定すると危険です。
ChatGPTに渡した依頼内容

GUI Codexは、ChatGPTに対してかなり具体的な条件を渡しました。ここで重要なのは、単に「FAQを作って」と頼まなかったことです。
依頼条件の整理
依頼種別はFAQ 3問生成。記事テーマは、WordPressのバックアップとは何かを初心者向けに解説する記事。想定読者は、WordPressでサイトやブログを運営し始めた初心者です。
検索意図は、WordPressのバックアップとは何か、何をバックアップすればよいか、初心者が注意すべき点を知りたい、という内容に整理しました。
事実・推測・未確認を分ける
ChatGPTが断定してよい情報として、次の内容を渡しました。
- WordPressサイトは、テーマ、プラグイン、画像などのファイルと、記事本文や設定などを含むデータベースで構成される
- バックアップは、トラブル時に復元するためにデータのコピーを残すことを指す
- バックアップ方法には、レンタルサーバーのバックアップ機能、WordPressプラグイン、手動バックアップなどがある
推測として扱う情報、未確認として扱う情報も明示しました。特定のサーバー会社のバックアップ仕様、特定プラグインの料金や機能、最新のWordPressバージョン固有の仕様は本文で断定しません。
禁止表現と文体条件
過剰な断定や煽りを防ぐため、禁止表現も指定しました。
- 絶対
- 必ず
- 誰でも簡単
- 完全
- 最強
- 100%
- 確実に
- 放置するだけ
- これだけでOK
- 失敗しない
- 保証します
文体条件は、落ち着いた敬体、初心者にも分かりやすい、煽らない、過剰に断定しない、専門用語は短く補足する、冗長にしない、自然な日本語にする、という内容です。
ChatGPTの初回出力

ChatGPTは、FAQ 3問を生成しました。
FAQ-01:WordPressのバックアップとは何ですか?
FAQ-01では、WordPressのバックアップとは何かを説明しました。WordPressのバックアップとは、トラブル時の復元に備えて、サイトのデータのコピーを残すこと。WordPressサイトは、テーマ、プラグイン、画像などのファイルと、記事本文や設定を含むデータベースで構成されている。
この回答は、依頼時に渡した事実情報の範囲内で書かれていました。そのため、採用可と判断されました。
FAQ-02:WordPressでは何をバックアップすればよいですか?
FAQ-02では、バックアップ対象について説明しました。画像やテーマなどのファイルだけでなく、記事本文や設定を含むデータベースもバックアップ対象として考える必要がある。ファイルだけを保存すると、記事や設定の復元に困る可能性がある。
この回答も、依頼内容に沿っていました。初心者が誤解しやすい「ファイルだけ保存すればよい」という点にも触れています。こちらも採用可です。
FAQ-03:初心者がバックアップで注意すべきことは何ですか?
FAQ-03では、初心者向けの注意点を説明しました。一見すると自然な回答です。しかし、ここでChatGPT自身が「要修正」と判断しました。
理由は、復元方法の確認が推測情報に基づくためです。ここが今回の実験でかなり面白い点です。
ChatGPTは単にFAQを生成しただけではありません。自分の出力の中で、どこが推測に寄っているかを自己申告しました。
GUI Codexによる検査

次に、GUI CodexがChatGPTの出力をFAQ単位で検査しました。
検査項目
- 検索意図
- 依頼条件
- 事実・推測・未確認の分離
- 禁止表現や過剰断定
- 回答の厚み
- Markdown化・差分管理
検査項目を増やしすぎないことも重要です。厳密にしようとして項目を増やしすぎると、今度は運用できなくなります。
FAQ単位の判定
FAQ-01とFAQ-02は、すべての項目でOKでした。検索意図、依頼条件、事実・推測・未確認の分離、禁止表現や過剰断定、回答の厚み、Markdown化・差分管理のいずれも問題なく、採用可と判断されました。
FAQ-03は、検索意図や文体には問題がありませんでした。ただし、「事実・推測・未確認の分離」が要確認となりました。問題は、「復元方法も確認しておくと安心です」という表現です。
この表現自体が完全に悪いわけではありません。ただ、依頼時点では「復元方法を確認していないと困る可能性がある」は推測情報として扱っていました。そのため、本文ではもう少し慎重に表現する必要があります。
FAQ-03だけを差分修正した

ここで重要なのは、全体を再生成しなかったことです。FAQ-01とFAQ-02は採用。FAQ-03だけ要修正。この状態で、ChatGPTにFAQ-03のみの修正を依頼しました。
なぜ全体再生成しないのか
AIに修正を頼むと、よくある問題があります。「ここだけ直して」と言ったのに、全体が変わる。
採用済みの部分まで言い換えられる。見出しも変わる。表現も変わる。なぜか余計な補足も増える。
AIの親切心は、ときどき破壊活動に近いです。

採用済みの文章まで親切に直されると、制作ラインでは普通に困ります。
そのため、今回のようにFAQ単位で採用・修正を分けることが重要になります。
修正条件
- FAQ-03のみ出力
- 質問は維持しても変更してもよい
- 回答は120〜200字程度
- 復元方法への言及は効果保証ではなく注意喚起にする
- 「可能性があります」「確認しておくと対応しやすくなります」のように慎重な表現にする
- 特定サーバー、特定プラグイン、料金、最新仕様には触れない
- 最後に修正理由を2行以内で付ける
修正版FAQ-03

修正版の趣旨は次の通りです。
バックアップ方法には、レンタルサーバーの機能、WordPressプラグイン、手動バックアップなどがある。初心者は、どの方法で何が保存されるのかを確認しておくと、トラブル時に対応しやすくなる可能性がある。
この表現では、「安心です」というやや広い表現から、「対応しやすくなる可能性があります」という慎重な表現に変わっています。
修正後の表現は、効果保証ではありません。断定でもありません。推測情報として扱いやすい表現です。つまり、FAQ-03は採用可能な状態になりました。
v0.1実験の結果

最終的に、FAQ 3問はすべて採用可能となりました。ChatGPT側も、v0.1テストをPASSと判定しました。
成立した流れ
GUI Codexが依頼条件を整理する。
ChatGPTがFAQ 3問を生成する。
ChatGPTが判断に迷った箇所を自己申告する。
GUI CodexがFAQごとに採用可・要修正を判定する。
問題のあるFAQ-03だけをChatGPTに修正させる。
GUI Codexが修正版を確認し、FAQ-03を採用可にする。
これは、非常に小さなワークフローです。しかし、記事制作においては、この「小さく回る」ことが重要です。
大きな記事を一気に作るよりも、検査可能な小さな単位に分ける。問題箇所だけ直す。採用済みの部分は壊さない。この考え方が、AIを制作工程に組み込むうえでかなり現実的です。
この実験で分かったこと

1. ChatGPTとGUI Codexの役割分担は実用的
ChatGPTは、文章を作ることに強いです。一方でGUI Codexは、条件整理、検査、差分管理に向いています。この分担は、かなり自然に機能しました。
2. 初回テストはFAQ 3問がよい
初回テストにFAQ 3問を選んだのは正解でした。FAQは、質問と回答が分かれていて、1問ごとに採用・修正・却下できます。
3. 事実・推測・未確認の分離は効く
今回、最も重要だったのはここです。依頼時点で、情報を事実、推測、未確認に分けました。
これにより、ChatGPTの出力が安定しました。特にFAQ-03では、ChatGPT自身が「ここは推測情報に基づくため要修正」と自己申告しました。
4. ChatGPTには自己評価を返させたほうがよい
ChatGPTには、本文だけでなく自己評価も返させるべきです。たとえば、FAQ-01は採用可、FAQ-02は採用可、FAQ-03は要修正、という情報です。
もちろん、ChatGPTの自己評価をそのまま信じるわけではありません。ただし、ChatGPT自身に不確実な箇所を出させることには価値があります。
5. 差分修正はFAQ単位なら成立しやすい
今回の大きな成果は、FAQ-03だけを修正できたことです。全体再生成ではありません。
採用済みの文章は固定し、問題箇所だけ直す。この運用ができると、AI生成文をかなり扱いやすくなります。
UI越しの運用で注意すべきこと

今回の実験では、ChatGPT Web UIを使いました。そのため、UI越しの運用ならではの注意点も見えました。
テンプレートは小さくする
最初のテンプレート案は、少し大きすぎました。コードフェンスが入れ子になる、コピー時にMarkdownの境界が崩れる、チェックリストが大きくなる、長文貼り付けで事故が起きやすい。こうした問題がありました。
コードフェンスを避ける
Markdownではコードフェンスが便利です。しかし、UI越しにやり取りする場合、コードフェンスが入れ子になると崩れやすくなります。
検査項目は増やしすぎない
検査項目が多すぎると、運用が重くなります。今回はFAQごとに6項目以内にしました。
完璧なチェックリストを作って誰も使わない。これもまた、人類が何度も繰り返してきた由緒正しい失敗です。

チェックリストは厳密さより、実際に回せる軽さが大事です。
この実験が示す「AI制作ライン」の可能性

今回の実験は、小さなFAQ生成テストです。しかし、見えているものは小さくありません。
AIを単体で使う段階から、工程に組み込む段階へ
これまでのAI活用は、文章を書かせる、要約させる、見出しを作らせる、アイデアを出させる、といった単体作業が中心でした。
もちろん、これだけでも便利です。ただし、実務ではそれだけでは足りません。記事制作には、設計、生成、検査、修正、採用、公開という工程があります。
今回の実験では、この工程の一部をAI同士の役割分担で回せる可能性が見えました。
ChatGPTは文章生成部品になる
今回の重要な見方は、ChatGPTを「会話相手」としてだけでなく、「文章生成部品」として扱ったことです。
GUI Codexが依頼条件を整える。ChatGPTが文章を生成する。GUI Codexが検査する。問題があれば、対象箇所だけ修正させる。この流れは、かなり実務的です。
GUI Codexは編集工程の管理者になる
GUI Codexは、文章を魅力的に書く役ではありません。むしろ、制作ラインを壊さないための管理者です。
- 条件を整理する
- 依頼文を作る
- 出力を保存する
- 差分を見る
- 禁止表現を検査する
- 採用可、要修正、不採用を判定する
この役割があることで、ChatGPTの文章生成を安全に使いやすくなります。
WordPress記事制作への応用

今回の実験は、WordPress記事制作にも応用できます。特に、初心者向け解説記事やSEO記事では相性が良いです。
FAQ生成
まず使いやすいのはFAQ生成です。記事テーマ、想定読者、検索意図、事実、推測、未確認を整理してから、ChatGPTにFAQを生成させます。
- 検索意図に合っているか
- 読者の疑問に答えているか
- 断定しすぎていないか
- 未確認情報が混ざっていないか
- 構造化データ化しやすいか
メタディスクリプション生成
次に向いているのは、メタディスクリプション生成です。メタディスクリプションは短文なので、検査しやすいです。
- 文字数が適切か
- 検索意図と合っているか
- 記事内容とズレていないか
- 煽りすぎていないか
- 禁止表現がないか
- クリック誘導が自然か
見出しリライト
見出しリライトにも応用できます。ただし、見出しは表現の好みが入りやすいため、FAQやメタディスクリプションより後に試すほうがよいです。
導入文生成
導入文は、さらに後で試すのがよいです。導入文は文章の温度感が重要で、主観評価が入りやすいため、制作ラインの検査方法がある程度固まってから扱うほうが安全です。
今後の拡張案

| バージョン | 対象 | 狙い |
|---|---|---|
| v0.2 | メタディスクリプション生成 | 短文で検査しやすく、SEO記事制作に直結する |
| v0.3 | 既存見出しリライト | 差分管理と見出し階層の検査に向く |
| v0.4 | 500〜800字の導入文 | 主観評価が増えるため、検査方法が固まってから扱う |
今回のv0.1はFAQ 3問生成でした。次に進めるなら、段階的に広げるのがよいです。
IABが操作層を持った場合(browser use使用)

今回の実験では、IABは「読む窓」、CDP付きBraveは「操作する窓」として使いました。しかしIAB とbrowser useがより高度な操作能力を持つ現在は、現実的には以下の流れになります。
IABが操作できるようになると何が変わるか
Codexが記事制作の条件を整理する。
IAB内のChatGPTへ依頼を送る。
Codexが生成結果を取得する。
Markdownへ保存し、checklistで条件違反や未確認情報を確認する。
問題箇所だけ再依頼し、必要ならWordPressへ反映してプレビューを確認する。
マコトこれができると、ChatGPT、WordPress管理画面、Google Docs、Notion、GitHub、CMSプレビューなどを、Codexの作業面としてシームレスに扱いやすくなります。
応用の方法は無限大です。ほんと無限大だ。
外部サービスが工程部品になる
この変化が起きると、外部Webサービスが制作工程の部品になります。今回の実験では外部Braveを使いましたが、判断、検査、差分管理のループ自体はすでに成立しています。
今回の実験が「エージェント的」だった理由

今回の実験は、単なるブラウザ操作ではありませんでした。GUI CodexとCDP付きBraveの組み合わせは、かなりエージェント的に動いていました。
実際に行ったループ
- ChatGPTの返答を読む
- 内容と意図を解釈する
- 次に聞くべきことを決める
- 文章を作る
- ChatGPTの入力欄に入れる
- 送信する
- 返答を待つ
- 返答を検査する
- 問題があれば修正依頼する
- 最終的にPASS判定まで持っていく
重要なのは「検査していた」こと
今回のGUI Codexは、ChatGPTの返答をそのまま受け入れませんでした。テンプレートが長すぎる、コードフェンスが崩れそう、断定範囲が広すぎる、FAQ-03は推測情報に寄っている、FAQ-03だけ差分修正すべき、修正後の表現なら採用できる。こうした判断を行っています。
単にChatGPTに送って、返ってきたものを保存しただけではありません。読んで、判断して、検査して、必要なところだけ直させています。この流れが成立したことに意味があります。
v0.1はPASS。FAQ単位の生成・検査・差分修正が成立し、事実・推測・未確認を分ける運用が有効に働きました。大きな自動化より、小さく作り、小さく検査し、小さく直す工程化が現実的です。
総合結論

今回の実験では、ChatGPTとGUI Codexの制作ラインは、少なくともv0.1の範囲で実用可能だと分かりました。
- GUI Codexが事実・推測・未確認を分けて依頼できた
- ChatGPTがFAQ 3問を生成できた
- ChatGPTが判断に迷った箇所を自己申告できた
- GUI CodexがFAQ単位で採用可・要修正を判定できた
- FAQ-03だけの差分修正ができた
- 修正版を採用可にできた
- v0.1としてPASS判定できた
これは小さな成果です。しかし、制作ラインとしては大きな意味があります。
大きな自動化ではありません。複雑な管理システムでもありません。派手なデモでもありません。
小さく作る。小さく検査する。小さく直す。採用できる部分を固定する。
この地味な流れこそ、AIを実務に組み込むうえで重要です。AI活用は、派手な一発生成よりも、検査可能な工程に落とし込めるかが勝負になります。
まとめ

ChatGPTとGUI Codexを組み合わせることで、記事制作の小さなパイプラインは成立しました。
ChatGPTは文章を書く。GUI Codexは条件を整え、検査し、差分を管理する。ユーザーは方向性と最終判断を担う。
この役割分担が機能すれば、AI記事制作はかなり扱いやすくなります。
- 事実・推測・未確認を分けて依頼する
- ChatGPTに判断メモと自己評価を返させる
- 問題箇所だけを差分修正する
今回の結論は明確です。
v0.1はPASS。
ChatGPTとGUI Codexによる制作ラインは、実用ラインに乗せる価値があります。
最初から巨大な自動化を目指す必要はありません。まずはFAQ 3問。次にメタディスクリプション。その次に見出しリライト。最後に導入文や本文へ広げる。
この順番で進めれば、AIを「便利なおもちゃ」ではなく、記事制作の工程部品として扱えるようになります。そして今回の実験は、その方向性が十分に現実的であることを示しました。








