【初心者向け】LangChainの開発効率を爆上げする必須ツール「LangSmith」の入門

LANGCHAIN_TRACING_V2 = true
LANGCHAIN_ENDPOINT = "https://api.smith.langchain.com"
LANGCHAIN_API_KEY = "your-api-key"    # LangSmithのAPIキーを入力してください
LANGCHAIN_PROJECT = "sample-project"  # 任意のプロジェクト名を入力してください
OPENAI_API_KEY = "your-api-key"       # OpenAIのAPIキーを入力してください

サンプルコードの作成

✅最小限のサンプルコードを作成する。

src/langsmith/min.py（ファイル名、保存場所は任意）

# 環境変数の準備
from dotenv import load_dotenv
load_dotenv()

# インポート
from langchain.chat_models import ChatOpenAI

# ✅質問の実行
llm = ChatOpenAI()
llm.invoke("Appleの創業者は誰ですか？")

✅質問の実行

# ✅質問の実行
llm = ChatOpenAI()
llm.invoke("Appleの創業者は誰ですか？")

「Appleの創業者は誰ですか？」という質問をしているだけ。
LangSmithに関する処理は一切ないが、ログを自動でLangSmithに出力してくれる✨

💡

環境変数のLANGCHAIN_TRACING_V2がtrueに設定されている場合、質問のログを自動でLangSmithに出力してくれる✨

サンプルコードを実行する

以下のコマンドを実行するだけ。

※パス、ファイル名は環境に応じて変える。

python src/langsmith/min.py

実行結果を確認する

✅LangSmithの管理画面で実行結果を確認できる！

💡

間違った回答の原因調査などに便利！

プロジェクトの画面へ移動する

まずLangSmithのページを開く。

📎

LangSmith管理画面：https://smith.langchain.com/

Projectsを選択。

「sample-project」を選択。

※プロジェクト名は環境変数LANGCHAIN_PROJECTで指定したもの。

実行の過程を確認する

確認したいログを選択する。

Runタブで入力、出力が確認できる。

※今回はシンプルな例だったので細かい実行過程が存在しない。

例：Agent（LangChainの機能）を使ったプログラミングを実行した場合

答えが出るまでの詳しい過程を1つずつ確認できる。

💡

間違った回答をされても、どこで間違いが発生しているのか特定できる！

その他の便利な機能

実行結果の確認以外にも管理画面でさまざまなことができる😊

代表的な機能は以下のとおり。

その場でLLMのパラメータを変更して再実行する
💡
どのパラメータがいいか？を微調整するのに便利！

テスト実行と自動評価
💡
カスタマイズしたモデルの精度を評価するのに便利！

その場でLLMのパラメータを変更して再実行する

プロジェクト画面で、確認したいログを選択する。

Playgroundを選択

パラメータや質問文を変更して、再実行。

💡

わざわざコードを修正せずに管理画面上で微調整できてめっちゃ楽！

回答が合っているか自動で評価してもらう

💡

評価してもらうまでの流れ

まずサンプルとなる質問と回答を用意する。
評価用のプログラムを作成する。
評価用のプログラムを実行後、管理画面で評価結果を確認する。

✅まずはサンプルとなる質問と回答を用意する。

サンプルの用意の仕方は主に2種類ある。

管理画面で登録（今回はこっち！）
Pythonプログラムで登録（公式ドキュメントを参照）

プロジェクト画面で、サンプルとして登録したいログを選択する。

Add to Datasetを選択

データセットの名前を入力する

（今回はデータセット名をsample-datasetとする）

Submitを選択

これでデータセット（サンプル）が登録できた😊

サイドバーのDatasets & Testingを選択すると登録したデータセットを確認できる

✅評価用のプログラムを作成する。

src/langsmith/eval.py（ファイル名、保存場所は任意）

# 環境変数の準備
from dotenv import load_dotenv
load_dotenv()

# インポート
from langchain.chat_models import ChatOpenAI
from langchain.smith import run_on_dataset, RunEvalConfig
from langsmith import Client

# データセット名
dataset_name = "sample-dataset"

# LangSmithのクライアント
client = Client()

# LLMを準備
llm = ChatOpenAI(temperature=0)

# 評価の設定
eval_config = RunEvalConfig(
  evaluators=[
    "qa"
  ]
)

# 評価の実行
run_on_dataset(
    dataset_name=dataset_name,
    llm_or_chain_factory=llm,       # LLMのインスタンス
    evaluation=eval_config,         # 評価の設定
    client=client,                  # LangSmithのクライアント
    verbose=True,                   # 実行ログを表示
    project_name="sample-test-1",   # 任意のプロジェクト名
)