【Python】Ollama + Writer Framework(旧Streamsync)で、無料で使えるChatBot作ってみた

こんにちは。

最近ローカルLLMツールのOllamaにハマっております。

先月、Gemini APIが無料枠出たから、これ使いましょうって話の記事出しましたが、それももう使わずにローカルLLMでEnjoyしてます。

こんにちは。あけましておめでとうございます。本年も当サイトをよろしくお願いいたします。今回はGemini APIがついに無料で使えるようになったので、その紹介をしたいと思います。LLMのAPI料金の概要LLMの大手としてはOpenAI、Go...

少し前までは、ローカルLLMというと、そのままでは正直使い物にならない性能でした。

おまけに実装も大変で、GPUなどのコストも高いため、大企業や研究機関がファインチューニングに明け暮れてるというイメージでした。（ちょっと偏見入ってます）

しかし！Ollamaの存在を知り使っていくにつれ、その考えを改めました！

まずGPUなくても動きます。

量子化という技術のおかげでモデルのサイズも４～8GB程度なので、PCのメモリが16GB以上あればよっぽど問題なく動きます。

インストールもめちゃくちゃ簡単です。(後述)

性能面でもいくつか軽量なモデルを試しましたが、一昔前のgpt-3.5等よりも性能が良いと感じてます。（当社比）

つまり、私のローカルLLMに対する課題と偏見を全てクリアしています！

そしてなんとこれがオープンソース！無料！

ついにLLMも本当の意味でオープンソース化したと思わせてくれたのがこのOllamaなんです！

という訳で今回はOllamaの導入方法をメインに、Writer FrameworkでChatBotを作ってみたいと思います。

Ollamaのインストール
Ollamaモデル準備
Writer Framework準備
1. 補足：最近のおすすめ仮想環境「uv」
Chatbotの作成
まとめ

Ollamaのインストール

Ollama公式ページで、「Download」ボタンから、ダウンロードしてインストールしましょう。

Ollama

Get up and running with large language models.

これでインストール終了です！

…いや、マジです。これで本当に終わりです。

詳しい使い方は公式や他の方々が色々記事にしてくださってますので割愛します。

Ollamaモデル準備

今回私はWindowsから行います。

MacでもLinuxでもやり方は大きく変わりません。

インストールしたOllamaアプリを起動した状態にして、コマンドプロンプトを開きましょう。

まずは問題なくインストールできたか、確認のため、

ollama -v

と入力しましょう。

versionが表示されればOKです。

では次に今から使いたいローカルLLMをダウンロードしましょう。

とりあえずChatBot作りたいので、「llama3.2」をダウンロードします。

ollama pull llama3.2

これでダウンロードが開始されます。

ダウンロードが終わったら、以下のコマンドで確認しましょう。

ollama list

Dockerみたいに確認できます。

これでOllamaに関する準備は以上です。

Writer Framework準備

ではChatBotを作りましょう。

まずはお使いの開発用の仮想環境をご準備いただき、Writer FrameworkとOllamaをインストールしてください。

pip install writer ollama

Writer Frameworkの使い方などの詳細については私の記事を参照ください。

基本的にこれで準備完了です。以下は私のおすすめでuvの場合の手順を紹介しています。

uvを使わない方は、次の「ChatBotの作成」まで進んでください。

補足：最近のおすすめ仮想環境「uv」

以下はuvを使った解説していきます。

インストール方法については割愛しますので、以下公式を参照ください。

Installation | uv

uv is an extremely fast Python package and project manager, written in Rust.

poetryに関して、以前紹介しましたが、uvを知ったら戻れなくなりました。

【Python】Poetryで仮想環境を構築しよう！

こんにちは今回はPoetryのインストールから使い方までの導入手順をまとめて紹介しようと思います。これまでPythonの仮想環境といえば「venv」や「anaconda」を紹介してきました。今回は開発現場などでも使われる「Poetry」につ...

まずはuvのPythonバージョンを3.12に設定しておきます。

uv python install 3.12

プロジェクトを作りましょう

uv init ollama_chatbot

ollama_chatbotの部分はプロジェクト名なのでなんでもいいです。

次にカレントディレクトリを作成したプロジェクトに設定します。

cd ollama_chatbot

ではwriterとollamaを追加します。

uv add writer ollama

はい、これで必要なものの準備は全て終わりました！

ではこれからChatbotを作りましょう！

Chatbotの作成

以下のコマンドでWriter Frameworkのプロジェクトを作成しましょう。

uv run writer create llama_demo

llama_demoがプロジェクト名です。

次にプロジェクトのアプリを立ち上げます。

uv run writer edit llama_demo

上記URLにアクセスすると、いつものアプリが立ち上がります。（また少し雰囲気が変わっている・・・！）

ただ別にいらないので、いつものようにSectionの中身は消しておきましょう。

消し方はいつも通りで、左側のSection以下の「Column Container」をクリックしてDelボタンで消えます。

空にしたら、左側のContentから「Chatbot」をドラッグアンドドロップしてください。

Chatbotエリアをクリックして、右側の歯車の「Expand Settings」をクリックして設定画面を開きます。

下の方の「Events」があるので、「wf-chatbot-message」の右にある「？」マークをクリックしましょう。

すると以下のサンプルコードが出るのでコピーします。

一旦フロントエンドを止めて、バックエンドに移ります。

llama_demoプロジェクトフォルダ内のmain.pyを開きます。

はい、これも大体要らないので、以下のように大体消してください。

消したら、先ほどコピーしたコードをmain.pyに貼り付けてください。

貼り付けたら、あとは以下のようにollamaのchatコードを追加し、initial_stateを修正します。

import writer as wf

from ollama import chat
from ollama import ChatResponse


def handle_message_simple(payload, state):
    # user側のroleとcontent(query)を追加
    state["conversation"] += [payload]
    # queryに対する回答を追加
    response: ChatResponse = chat(
        model="llama3.2",
        messages=[
            {
                "role": "user",
                "content": payload["content"],
            },
        ],
    )
    answer = response["message"]["content"]
    state["conversation"] += [{
        "role": "assistant",
        "content": answer
    }]


initial_state = wf.init_state(
    {
    "conversation":
        [
            {
                "role": "assistant",
                "content": "何かお手伝いできることはありますか？"
            },
        ],
    }
)

ollamaのコードは公式Gitのチュートリアルコードをそのまま使ってます。