Initial upload: Local LLM Prompt Manager CLI tool

2026-02-05 20:56:09 +00:00
parent cf2ad96b8b
commit 3aa0da245b
1 changed files with 79 additions and 0 deletions
--- a/src/llm/lmstudio.py
+++ b/src/llm/lmstudio.py
@@ -0,0 +1,79 @@
 """LM Studio LLM client implementation."""
 from collections.abc import Iterator
 import requests
 from ..config import get_config
 from .base import LLMClient
 class LMStudioClient(LLMClient):
    """Client for LM Studio API."""
    def __init__(self, url: str = None):
        config = get_config()
        self.url = url or config.lmstudio_url
    def generate(self, prompt: str, model: str = None, **kwargs) -> str:
        """Generate a response using LM Studio API."""
        payload = {
            "messages": [{"role": "user", "content": prompt}],
            "max_tokens": 1024,
            "temperature": 0.7,
        }
        payload.update(kwargs)
        response = requests.post(
            f"{self.url}/v1/completions",
            json=payload,
            timeout=120
        )
        response.raise_for_status()
        data = response.json()
        return data.get("choices", [{}])[0].get("text", "")
    def stream_generate(self, prompt: str, model: str = None, **kwargs) -> Iterator[str]:
        """Stream a response using LM Studio API."""
        payload = {
            "messages": [{"role": "user", "content": prompt}],
            "max_tokens": 1024,
            "temperature": 0.7,
            "stream": True,
        }
        payload.update(kwargs)
        response = requests.post(
            f"{self.url}/v1/completions",
            json=payload,
            stream=True,
            timeout=120
        )
        response.raise_for_status()
        for line in response.iter_lines():
            if line:
                data = line.decode("utf-8")
                if data.startswith("data: "):
                    data = data[6:]
                    if data != "[DONE]":
                        import json
                        parsed = json.loads(data)
                        chunk = parsed.get("choices", [{}])[0].get("text", "")
                        yield chunk
    def test_connection(self) -> bool:
        """Test if LM Studio is available."""
        try:
            response = requests.get(f"{self.url}/v1/models", timeout=5)
            return response.status_code == 200
        except requests.exceptions.RequestException:
            return False
    def get_available_models(self) -> list[str]:
        """Get list of available models from LM Studio."""
        try:
            response = requests.get(f"{self.url}/v1/models", timeout=5)
            if response.status_code == 200:
                data = response.json()
                return [m.get("id", "") for m in data.get("data", [])]
        except requests.exceptions.RequestException:
            pass
        return []