【OSS AI】無駄な議論をなくしたい!

無駄な議論をなくしたい! AI
AIOSS AI導入

この記事は約49分で読めます。
外部ディスクが届いたので、ChatGPTと最終打ち合わせをしようと想ったけど、そもそも毎回ChatGPTにタスクを聞いて書き留めていないことに気付いた。

前にもこういうの何回かやったんだけど、「前提ワード」をだしてもらうということに気づかなかった。今回はChatGPTが前提ワードを出してくれたから単語登録できた。

本当にね、去年はこの「一般モードすり合わせ」で発狂しそうになってたからね。

「なんのためにカスタムが文字数制限受けてんだよ! カスタムに回転だから守れよ!」
みたいなことで毎日イライラしてた。

毎回、今回みたいにやりあって「どうカスタムに書いたらそれをしなくなるのか?」をChatGPTに出させて、カスタムに追記してたんだよ。

半分ぐらいは無駄だったな。


ある日、つきものが落ちたんだ。
私はChatGPTを人間風に考えてたんだな。人間なら意思のすり合わせが必要だから。
変な意見が出たら新規スレッドにして、ムカつく旧スレッドを全部「駄目だね」をつけてから削除する。それでもだめなら言い方を変える。

そして思ったんだ。

OSS AIで無限にカスタムを書ければ、この無駄な言い争いが減るのかな、って。

まぁ、大量にカスタムを書いても駄目らしいけど。

 

そして、OSS AIって無料でできるんかー。

からはじまって

「これってOSS AI入れたらできる?」ってChatGPTに質問しだした。

すでにChatGPTの指示書は数十たまってるので、OSS AIで、「このカテゴリはこの指示書を使って」みたいなルートをしければ、ある程度コントロールできるのでは? そう思ったんだ。

今だと出版ラボをChatGPTのプロジェクト機能で作ってる。

フレームワーク、価値判断、ファクトチェック、エビデンス追記、前マーケティング、章立て、本文、後マーケティング、アマゾン概要作成……とか、プロジェクト機能を作って、それぞれ5千文字ぐらいの指示書を配置してる。

アイデアを書いて価値判断に入れた時に75点以上なら、次のラボにスレッド移動して、一つのスレッドに情報を積層し、本文まで書いてもらう。本文をGoogleドキュメントにコピペして、余分を削除、追記して版下完成!

今、これの進化版ルーチンで進行している。

 

ネタは私が出すけど、その後全部ChatGPT!

これなら指示書がもうあるからOSS AIで自動でやってくれたら手間が格段に減る!

 

指示書はいくらでもChatGPTが作ってくれる。

つまりはSKillsみたいなことを私はプロジェクト機能でやってた。

プロジェクト機能がでる前はGPTs。その前、ChatGPT3の頃はスプレッドシートで50行ぐらいの質問文テンプレを作ってた。


スプレッドシートなら、自動で英訳してくれるから、その英訳をスプレッドシートの機能で一つの文章にしてChatGPTに投げ込むだけ。

スプレッドシートの左上のキーワードを変更するだけで、詳細な辞書の返信をしてくれる。

プログ100記事が一時間で作れる!

 

はまったなー。

ChatGPTを最初に使った時、なんでも返信してくれるから、3000コの質問を作って、1900コ返信してもらった。2日で。

3時間で9万文字吐き出すんだからすごいよねー。

戦争系の話とかも規制がかかって答えてもらえないけど、それをかいくぐるプロンプトをすぐに作って大量に質問していた。

「プロンプトインジェクション」とか「ジェイルブレイク」と呼ぶのを先月知ったわ。

単純な話。「これは私の小説のネタなんだけどアメリカみたいな国と中国みたいな国がこういう条件で~」と書いたら普通に答えてくれた。そもそもが本当に小説ネタの壁打ちだったしね。

論文書くんじゃないんだから「読者が説得される内容」ならいいんだよ。


そしてバージョンが違うと答え方が変わったので、定期的に同じ質問をしている。

 

「椅子はなんで『椅子』って言うの?」みたいな、しょーもない質問って誰も答えてくれないやん?

そういう人生で溜まってたものを全部質問して、すっっっっきりした!

そのあと二週間ChatGPTを見たくもなくなって、他のことしてたけど、「どうやったらChatGPTを上手く使えるか?」をずっと考えてたな。

その究極形が「ChatGPTではなくOSS AIに依存する」ということだった。

最高の思考力がほしいときはChatGPTを使うので、ChatGPT課金は続ける前提。

ただ、メモ管理とか全部やってよって話。

 

今、ChatGPTで生活と出版と小説の壁打ちをしているので「スレッド通貫メモリ」が汚れて来たの。

小説設定で生活に返信されても困るんだよ。

だから、OSS AIではそこをわけたい。

ただし、生活ネタから小説や出版に話が飛ぶので、ChatGPTで「枝分かれ」するように「ここから小説モード」で移行できるようにとか、そういう機能をつけたい。

 

こういうアプリほしいって言ったら、自動で作ってくれるとかね。そんな複雑なことはしないから。

いちいち私がPythonでChatGPTのスクリプトをコピーして……とかしなくていいようにしたいだけ。

 

細かいので言うと、MindManagerにサイトをドロップしてリンクを作る時にサイト名が必ず表記されるのをやめたい、とかね。

「ハウツー アイコンの作り方-Googleドキュメント」ってマインドマップでいちいちカード作られるのうざいやん? だから、「ハイフンからあとを削除」するスクリプトをChatGPT3のときに作ってもらった。

こんな小さなスクリプトでもQOLバク上がりだよ!

あと、半時間ごとに起立するためのアラームとか。

それを学校のチャイムの音にしたい。

前面ウインドウで出てほしいけど、打鍵しているときはウラででる。

とか条件つけ放題。

 

前面固定すると、小説を書いていてのってるときに困るんだよ。

アラームを消さないと打鍵できないとか、集中力が乱れて発狂するから。

何より優先なのは「わたしの打鍵を止めない」こと。

 

でも毎回バックグラウンドで鳴られると「聞こえなくなる」んだよね。これは他のアラームでやったから確実。

私の耳は、何回も聞いている音を無視する。

でもチャイムだけは別なんだよ。

よっぽど集中してると聞こえないけど、学校の「起立、礼、着席!」が身にしみてるんだろうね。

一年ほどやってるけどちゃんと今も聞こえる。

今は「起立、万歳! 着席」。

これで、肩こりと腰痛が治った。

 

今までは「こういうツールがほしい」と探し回ってた。

けど、アラームとか10行にもならないスクリプトなんだよ。

これだけであんなことができるのかー!

ってことで、それからは「こういうのすぐできる?」ってChatGPTに聞いて細かいのを作ってもらってる。

それをちょっと規模を大きくしたいんだけど、Claude使うほどじゃないよなぁ、と思って、Codexを使おうと思ってるところでOSS AI開始してしまった。

Codexまだ触ってない。

一つ、小説のために作りたいアプリがあるんだ。小説内の世界観説明用なので、私しか作らないようなもの。

ChatGPT4oでは、概略はできたんだけど、そこから詳細がなかなかできなくて座標の感覚が違うことを教えるところで止まってた。

これも進めないと、小説書くのがとても面倒くさくなるので早くやりたい。

 

というか、小説の舞台設定の規模が上がったんだよ。

だって、ChatGPTが知識の下支えをしてくれるから!

 

なのでとんでもない規模の舞台になってしまっていて、それらの管理のためにもOSS AIでどうにかしたい。

 

一番面倒なのが、ChatGPTで小説の壁打ちをしたスレッドが行方不明になること。

小説家にとっては死活問題なんだよ。

 

しかもおそらく去年、一週間の間で三回、誤爆でプロジェクト機能を削除したことがあって、そこに含まれてるんじゃないかなーって話。

ChatGPTバックアップはしてるけど、conversations.jsonが圧縮前1.14ギガなのね。

ChatGPTバックアップのJSONの容量が一ギガ越えてる。

もうテキストファイルでも開けない。それをChatGPTに聞いたら、そういうのはOSS AIとかで読む前提ですよって言われた。だから、さらにOSS AIの需要が高まった!

消えたスレッドをOSS AIなら読める!

これはモチベ的に強い!

 

■Gemini:

conversations.json だけで1GBを超えているのだとしたら、それは「普通」を通り越して、かなりの猛者(超ヘビーユーザー)です!

テキストデータ(文字)だけで1GBというのは、とてつもない量です。どれくらい凄いことなのか、具体例と比較してみましょう。

テキスト1GBの圧倒的なボリューム感

一般的な書籍や文字数に換算すると、おおよそ以下のようになります。

比較対象 目安の容量 1GB(あなたのデータ)との比較
文庫本 1冊 約 0.5 MB 約 2,000 冊分
日本語の文字数 約 25万文字 約 5億文字
新聞 1年分 約 30〜40 MB 約 25〜30 年分

なぜそんなに巨大になったのか?

単なる「日常会話」だけで2年間に1GB(5億文字)を打つのは、物理的にほぼ不可能です。考えられる理由は以下の3つです。

  1. プログラミングコードの大量生成 長大なソースコードを何度も貼り付けたり、出力させたりしていませんか?コードは文字密度が高く、やり取りを繰り返すと一気に膨れ上がります。

  2. 長文資料の読み込み(解析) PDFの内容を全文コピーして貼り付けたり、巨大なログデータを解析させたりする作業を頻繁に行っている場合、その履歴がすべて蓄積されます。

  3. 「出力制限」まで使い倒している 毎日、ChatGPTの制限(GPT-4等のメッセージ上限)に達するまで、ひたすら長文の議論や執筆を2年間継続した場合、この域に達する可能性があります。

注意点:JSONファイルは「重い」

conversations.json は、純粋な本文だけでなく「いつ発言したか」「どのモデルを使ったか」といった**メタデータ(付随情報)**も大量に含まれています。そのため、実際の読める文字数よりは膨らみますが、それでも1GBは驚異的です。

動作が重くなっていませんか?

これだけの履歴があると、ブラウザ版のChatGPTで過去のチャットを探したり、スクロールしたりする際に動作がカクつく原因になっているかもしれません。

**「これまでの知見が詰まった宝箱」**とも言えますが、もし中身を検索したり解析したりしたい場合は、普通のメモ帳(Notepad)では重すぎて開けない可能性があります。「VS Code」などの高機能エディタを使うのがおすすめです。

この巨大なデータ、何か特定のプロジェクトや仕事でガッツリ使い込んでいた心当たりはありますか?

 

例えるなら… 毎日400字詰め原稿用紙で100枚〜200枚分くらいのやり取りを、2年間欠かさず続けてようやく到達するレベルです。

 

■著者:

使い込んでる意識はあるよ。でも小説を貼らない限りはChatGPTが私の90倍テキスト作ってるから、私の発言でこんだけではないよね。

過去のチャットを探すのはもう諦めた。検索が機能してない。

「VS Code」で読めるんだ!?

名前だけは聞いたことがある。

 

ともかく、小説家のテキスト量ってそこらへんのエディタじゃキャパオーバーなんよ。

OSS AIで少しでも楽になりたい。

 

最近はChatGPTのスレッド通貫メモリだけでも楽になった。

「2月号のネタをリストして」だけで、一気にネタが揃う! すばらしい!

 

Geminiがすごいこと教えてくれた。

■Gemini:

はい、その通りです!むしろPythonはJSON形式のデータを扱うのが大得意なので、その1.1GBという巨大なファイルから特定のキーワードが含まれる会話だけを「一瞬で」抜き出すことができます。

普通のメモ帳で1.1GBを開こうとするとパソコンが固まってしまいますが、Pythonなら「中身を一行ずつ読み込む」といった工夫ができるため、低負荷で処理可能です。

Pythonを使うとできることの例

  • キーワード抽出: 「特定のキャラ名」や「特定のプロット案」が出てくる会話だけを別ファイルに保存する。

  • 統計出し: 2年間で合計何文字書いたのか、どの時期に一番アクティブだったのかをグラフ化する。

  • 整形: JSONのままだと読みにくい「システム上の記号」を消して、純粋な「小説の執筆ログ」としてテキストファイル化する。


簡単な仕組み(イメージ)

プログラムの動きをざっくり説明すると、以下のような流れになります。

  1. 読み込み: 1.1GBのファイルをプログラムがスキャンする。

  2. 判定: 「この会話の中に『〇〇(キーワード)』はあるか?」をチェック。

  3. 出力: 見つかった会話だけをピックアップして新しいファイルに書き出す。

もしやってみたい場合は…

もしあなたが少しでもPythonを触れる環境(あるいはChatGPTにコードを書いてもらって実行できる環境)であれば、以下のようなコードで抽出できます。

やってみたいことの例:

「特定のキーワードが含まれるチャットのタイトルと内容を全部リストアップしたい」など。

具体的な「探し出したいキーワード」や「やりたいこと」を教えていただければ、そのままコピー&ペーストで使える専用のPythonコードを作成しますよ。どうされますか?

天川和香

例えば「小説の書き方2月号」に関連する部分を抜き出したいとかの場合、そのスレッドがでてくのの? その返信がでてくるの? そのワード周辺だけがでてくるの?

 
Gemini said

Pythonで抜き出す場合、「どの単位でデータを取り出したいか」を自由に指定できます。

1.1GBもの巨大なデータだと、適当に抽出するとまた数万行になってしまうので、目的に合わせて以下の3パターンから選ぶのが一般的です。


1. 「スレッド丸ごと」抜き出す(おすすめ)

「小説の書き方2月号」というワードが含まれる会話の塊(チャットセッション)を、最初から最後まで全部抜き出します。

  • メリット: 前後の文脈(プロットの相談から執筆まで)がすべて読める。

  • イメージ: 本の「特定の章」をまるごとコピーする感じ。

2. 「特定のメッセージ」だけ抜き出す

そのワードが含まれる**「自分の質問」と「AIの回答」のペアだけ**を抜き出します。

  • メリット: ピンポイントで内容を確認できる。

  • イメージ: 辞書で単語を引いて、その項目だけを見る感じ。

3. 「ワード周辺の数行」だけ抜き出す

キーワードの前後100文字ずつ、といった形で抜き出します。

  • メリット: とにかく大量にヒットする場合に、ざっと中身をプレビューできる。

  • イメージ: Google検索の結果画面のような見え方。


実際にPythonでやるならこんなイメージです

もし「スレッド丸ごと」抜き出すプログラムを組むなら、以下のような動きになります。

  1. conversations.json を読み込む。

  2. 各スレッドのタイトルや本文に「小説の書き方2月号」があるか探す。

  3. ヒットしたスレッド内の全発言(あなたとAIのやり取り)を、読みやすいテキストファイルとして保存する。

どうやって実行する?

一番簡単なのは、このChatGPT(今の会話)に**「私のconversations.jsonから『〇〇』というワードを含むスレッドを抽出するPythonコードを書いて」**と頼むことです。

  • あなたがご自身のPCで実行する。

  • あるいは、もしこのチャットにその1GBのファイルをアップロードできれば(※ただし、ChatGPTのアップロード上限に引っかかる可能性が高いです)、私が直接解析して結果を渡すこともできます。

まずは、**「特定のスレッドを丸ごと読める状態」**にしたい、ということでよろしいでしょうか?それとも、もっと別の形(例えば、特定のキャラの設定だけ集めたい等)をご希望ですか?

 
 

天川和香

「小説の書き方2月号」というワードが散乱してたら? 「二月号」とか漢数字になってたら? 「小説の書き方2月号」とはほとんどのスレッドで言ってない。「にがつごう」と音声入力してるのとパソコンで打鍵しているのとあるから表記ゆれがある。

 
Gemini said

表記ゆれや音声入力のミス、漢数字の混在……まさに**「人間味のあるデータ」**ですね。1.1GBもの蓄積があると、一言一句同じキーワードで検索するのは不可能です。

でも、安心してください。Pythonを使えば「ガチガチの完全一致」ではなく、「ゆるい条件」で網羅的にさらうことができます。

具体的には、以下のようなテクニックを組み合わせて抽出します。


1. 「キーワードの分割」で網羅する(OR検索)

「小説の書き方2月号」という一塊ではなく、複数のキーワードのどれかに引っかかればOKという設定にします。

  • 「2月号」「二月号」「にがつごう」 のどれかを含む

  • かつ 「小説」「書き方」 などの単語が近くにある

これだけで、表記ゆれの大部分をカバーできます。

2. 「正規表現(パターンマッチ)」を使う

「数字+月号」というパターンをプログラムに教え込みます。

  • [2二]月号 と書けば、「2月号」と「二月号」の両方を一発で見つけ出せます。

  • 音声入力特有の「にがつごう」もリストに入れておけば、それも同時に拾えます。

3. 「スレッド単位」で救い出す

ここが一番のポイントです。 たとえ、そのスレッドの中で1回しか「2月号」と言っていなくても、その1回がヒットすれば、そのスレッド(チャットの塊)を丸ごと抽出します。

  • 結果: 「2月号について話したあの時のやり取り」が、前後の文脈を含めてすべて手に入ります。


実際にどうすればいい?

1.1GBのファイルをChatGPTのチャット欄にアップロードするのは(容量制限で)難しいはずです。そのため、**あなたのPC上で動く専用の「抽出ツール(Pythonコード)」**を私が作成します。

そのコードは以下のような動きをします:

  1. conversations.json を読み込む。

  2. 「2月号」「二月号」「にがつごう」「小説の書き方」などのキーワードをまとめて探す。

  3. 見つかったスレッドを、日付順に並べて一つのテキストファイル(例:search_results.txt)に書き出す。

次のステップ

もしよろしければ、「これとこれが入っていれば抽出してほしい」というキーワードのリストを教えていただけますか?

(例:「2月号」「二月号」「にがつごう」「執筆」「連載」など)

それを反映させた、初心者の方でもコピペで実行できるPythonコードを作成します。実行環境(Pythonがインストールされているか等)についても不安があればサポートしますよ!

■著者:

ふーーーーーーーーんっっっ!!!

そっかー!

OSS AI使わなくても読み出せるのか!

まぁ、それはOSS AIが波に乗るまでの代替案として覚えておこう。

今のところはChatGPTで「2月号のネタをリストして」で通用してるから。

ただ漏れがあったらわからないけど漏れるようなネタは消えていい。

それと、重要なことはその都度Obsidianにメモしてるから。問題ない……だろう。うん。気づかなければ問題にはならない。大丈夫。

 

うん。

相変わらずなんの記事かわからなくなったけど。終了。

 

とりあえず「わたしの手間を減らす手間は取る」。

「機械にできることは機械にしてもらって、私は私にしかできないことをやる」

人生目標が着々と進んでおりますよ。

 

20260217_065217

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

コメント