feat(workers): Extract Coder and Executor nodes into Data Analyst worker subgraph

2026-02-23 04:58:46 -08:00
parent 5324cbe851
commit cb045504d1
6 changed files with 330 additions and 0 deletions
--- a/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/init.py
+++ b/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/init.py
--- a/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/coder.py
+++ b/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/coder.py
@@ -0,0 +1,61 @@
 from typing import Dict, Any, List, Optional
 from ea_chatbot.graph.workers.data_analyst.state import WorkerState
 from ea_chatbot.config import Settings
 from ea_chatbot.utils.llm_factory import get_llm_model
 from ea_chatbot.utils import database_inspection
 from ea_chatbot.utils.logging import get_logger, LangChainLoggingHandler
 from ea_chatbot.graph.prompts.coder import CODE_GENERATOR_PROMPT
 from ea_chatbot.schemas import CodeGenerationResponse
 def coder_node(state: WorkerState) -> dict:
    """Generate Python code based on the sub-task assigned to the worker."""
    task = state["task"]
    output = state.get("output", "None")
    error = state.get("error", "None")
    vfs_state = state.get("vfs_state", {})
    settings = Settings()
    logger = get_logger("data_analyst_worker:coder")
    logger.info(f"Generating Python code for task: {task[:50]}...")
    # We can use the configured 'coder_llm' for this node
    llm = get_llm_model(
        settings.coder_llm,
        callbacks=[LangChainLoggingHandler(logger=logger)]
    )
    structured_llm = llm.with_structured_output(CodeGenerationResponse)
    # Data summary for context
    database_description = database_inspection.get_data_summary(data_dir=settings.data_dir) or "No data available."
    # VFS Summary: Let the LLM know which files are available in-memory
    vfs_summary = "Available in-memory files (VFS):\n"
    if vfs_state:
        for filename, data in vfs_state.items():
            meta = data.get("metadata", {})
            vfs_summary += f"- {filename} ({meta.get('type', 'unknown')})\n"
    else:
        vfs_summary += "- None"
    # Reuse the global prompt but adapt 'question' and 'plan' labels
    # For a sub-task worker, 'task' effectively replaces the high-level 'plan'
    messages = CODE_GENERATOR_PROMPT.format_messages(
        question=task,
        plan="Focus on the specific task below.",
        database_description=database_description,
        code_exec_results=f"Output: {output}\nError: {error}\n\n{vfs_summary}",
        example_code=""
    )
    try:
        response = structured_llm.invoke(messages)
        logger.info("[bold green]Code generated.[/bold green]")
        return {
            "code": response.parsed_code,
            "error": None, # Clear previous errors
            "iterations": state.get("iterations", 0) + 1
        }
    except Exception as e:
        logger.error(f"Failed to generate code: {str(e)}")
        raise e
--- a/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/executor.py
+++ b/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/executor.py
@@ -0,0 +1,96 @@
 import io
 import sys
 import traceback
 from contextlib import redirect_stdout
 from typing import TYPE_CHECKING
 import pandas as pd
 from matplotlib.figure import Figure
 from ea_chatbot.graph.workers.data_analyst.state import WorkerState
 from ea_chatbot.utils.db_client import DBClient
 from ea_chatbot.utils.vfs import VFSHelper
 from ea_chatbot.utils.logging import get_logger
 from ea_chatbot.config import Settings
 if TYPE_CHECKING:
    from ea_chatbot.types import DBSettings
 def executor_node(state: WorkerState) -> dict:
    """Execute the Python code in the context of the Data Analyst worker."""
    code = state.get("code")
    logger = get_logger("data_analyst_worker:executor")
    if not code:
        logger.error("No code provided to executor.")
        return {"error": "No code provided to executor."}
    logger.info("Executing Python code...")
    settings = Settings()
    db_settings: "DBSettings" = {
        "host": settings.db_host,
        "port": settings.db_port,
        "user": settings.db_user,
        "pswd": settings.db_pswd,
        "db": settings.db_name,
        "table": settings.db_table
    }
    db_client = DBClient(settings=db_settings)
    # Initialize the Virtual File System (VFS) helper with the snapshot from state
    vfs_state = dict(state.get("vfs_state", {}))
    vfs_helper = VFSHelper(vfs_state)
    # Initialize local variables for execution
    local_vars = {
        'db': db_client,
        'plots': [],
        'pd': pd,
        'vfs': vfs_helper
    }
    stdout_buffer = io.StringIO()
    error = None
    output = ""
    plots = []
    try:
        with redirect_stdout(stdout_buffer):
            # Execute the code in the context of local_vars
            exec(code, {}, local_vars)
        output = stdout_buffer.getvalue()
        # Limit the output length if it's too long
        if output.count('\n') > 32:
            output = '\n'.join(output.split('\n')[:32]) + '\n...'
        # Extract plots
        raw_plots = local_vars.get('plots', [])
        if isinstance(raw_plots, list):
            plots = [p for p in raw_plots if isinstance(p, Figure)]
        logger.info(f"[bold green]Execution complete.[/bold green] Captured {len(plots)} plots.")
    except Exception as e:
        # Capture the traceback
        exc_type, exc_value, tb = sys.exc_info()
        full_traceback = traceback.format_exc()
        # Filter traceback to show only the relevant part (the executed string)
        filtered_tb_lines = [line for line in full_traceback.split('\n') if '<string>' in line]
        error = '\n'.join(filtered_tb_lines)
        if error:
            error += '\n'
        error += f"{exc_type.__name__ if exc_type else 'Exception'}: {exc_value}"
        logger.error(f"Execution failed: {str(e)}")
        output = stdout_buffer.getvalue()
    return {
        "output": output,
        "error": error,
        "plots": plots,
        "vfs_state": vfs_state
    }
--- a/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/summarizer.py
+++ b/backend/src/ea_chatbot/graph/workers/data_analyst/nodes/summarizer.py
@@ -0,0 +1,42 @@
 from typing import Dict, Any, List, Optional
 from ea_chatbot.graph.workers.data_analyst.state import WorkerState
 from ea_chatbot.config import Settings
 from ea_chatbot.utils.llm_factory import get_llm_model
 from ea_chatbot.utils.logging import get_logger, LangChainLoggingHandler
 def summarizer_node(state: WorkerState) -> dict:
    """Summarize the data analysis results for the Orchestrator."""
    task = state["task"]
    output = state.get("output", "")
    error = state.get("error")
    settings = Settings()
    logger = get_logger("data_analyst_worker:summarizer")
    logger.info("Summarizing analysis results for the Orchestrator...")
    # We can use a smaller/faster model for this summary if needed
    llm = get_llm_model(
        settings.planner_llm, # Using planner model for summary logic
        callbacks=[LangChainLoggingHandler(logger=logger)]
    )
    prompt = f"""You are a data analyst sub-agent. You have completed a sub-task.
 Task: {task}
 Execution Results: {output}
 Error Log (if any): {error}
 Provide a concise summary of the findings or status for the top-level Orchestrator. 
 If the execution failed after multiple retries, explain why concisely. 
 Do NOT include the raw Python code, just the results of the analysis."""
    try:
        response = llm.invoke(prompt)
        result = response.content if hasattr(response, "content") else str(response)
        logger.info("[bold green]Analysis results summarized.[/bold green]")
        return {
            "result": result
        }
    except Exception as e:
        logger.error(f"Failed to summarize results: {str(e)}")
        raise e
--- a/backend/src/ea_chatbot/graph/workers/data_analyst/workflow.py
+++ b/backend/src/ea_chatbot/graph/workers/data_analyst/workflow.py
@@ -0,0 +1,50 @@
 from langgraph.graph import StateGraph, END
 from ea_chatbot.graph.workers.data_analyst.state import WorkerState
 from ea_chatbot.graph.workers.data_analyst.nodes.coder import coder_node
 from ea_chatbot.graph.workers.data_analyst.nodes.executor import executor_node
 from ea_chatbot.graph.workers.data_analyst.nodes.summarizer import summarizer_node
 def router(state: WorkerState) -> str:
    """Routes the subgraph between coding, execution, and summarization."""
    error = state.get("error")
    iterations = state.get("iterations", 0)
    if error and iterations < 3:
        # Retry with error correction
        return "coder"
    # Either success or max retries reached
    return "summarizer"
 def create_data_analyst_worker(
    coder=coder_node,
    executor=executor_node,
    summarizer=summarizer_node
 ) -> StateGraph:
    """Create the Data Analyst worker subgraph."""
    workflow = StateGraph(WorkerState)
    # Add Nodes
    workflow.add_node("coder", coder)
    workflow.add_node("executor", executor)
    workflow.add_node("summarizer", summarizer)
    # Set entry point
    workflow.set_entry_point("coder")
    # Add Edges
    workflow.add_edge("coder", "executor")
    # Add Conditional Edges
    workflow.add_conditional_edges(
        "executor",
        router,
        {
            "coder": "coder",
            "summarizer": "summarizer"
        }
    )
    workflow.add_edge("summarizer", END)
    return workflow.compile()
--- a/backend/tests/test_data_analyst_worker.py
+++ b/backend/tests/test_data_analyst_worker.py
@@ -0,0 +1,81 @@
 import pytest
 from unittest.mock import MagicMock
 from ea_chatbot.graph.workers.data_analyst.workflow import create_data_analyst_worker, WorkerState
 def test_data_analyst_worker_one_shot():
    """Verify a successful one-shot execution of the worker subgraph."""
    mock_coder = MagicMock()
    mock_executor = MagicMock()
    mock_summarizer = MagicMock()
    # Scenario: Coder -> Executor (Success) -> Summarizer -> END
    mock_coder.return_value = {"code": "print(1)", "error": None, "iterations": 1}
    mock_executor.return_value = {"output": "1\n", "error": None, "plots": []}
    mock_summarizer.return_value = {"result": "Result is 1"}
    graph = create_data_analyst_worker(
        coder=mock_coder,
        executor=mock_executor,
        summarizer=mock_summarizer
    )
    initial_state = WorkerState(
        messages=[],
        task="Calculate 1+1",
        code=None,
        output=None,
        error=None,
        iterations=0,
        plots=[],
        vfs_state={},
        result=None
    )
    final_state = graph.invoke(initial_state)
    assert final_state["result"] == "Result is 1"
    assert mock_coder.call_count == 1
    assert mock_executor.call_count == 1
    assert mock_summarizer.call_count == 1
 def test_data_analyst_worker_retry():
    """Verify that the worker retries on error."""
    mock_coder = MagicMock()
    mock_executor = MagicMock()
    mock_summarizer = MagicMock()
    # Scenario: Coder (1) -> Executor (Error) -> Router (coder) -> Coder (2) -> Executor (Success) -> Summarizer -> END
    mock_coder.side_effect = [
        {"code": "error_code", "error": None, "iterations": 1},
        {"code": "fixed_code", "error": None, "iterations": 2}
    ]
    mock_executor.side_effect = [
        {"output": "", "error": "NameError", "plots": []},
        {"output": "Success", "error": None, "plots": []}
    ]
    mock_summarizer.return_value = {"result": "Fixed Result"}
    graph = create_data_analyst_worker(
        coder=mock_coder,
        executor=mock_executor,
        summarizer=mock_summarizer
    )
    initial_state = WorkerState(
        messages=[],
        task="Retry Task",
        code=None,
        output=None,
        error=None,
        iterations=0,
        plots=[],
        vfs_state={},
        result=None
    )
    final_state = graph.invoke(initial_state)
    assert final_state["result"] == "Fixed Result"
    assert mock_coder.call_count == 2
    assert mock_executor.call_count == 2
    assert mock_summarizer.call_count == 1