Added support for filtering

2026-06-27 13:16:26 +00:00 · 2026-06-11 15:40:53 +02:00 · 2026-06-11 15:40:53 +02:00 · d58f093124
commit d58f093124
parent ec7c83adfa
2 changed files with 51 additions and 7 deletions
--- a/Studio/Provider/SelfHosted/ModelsResponse.cs
+++ b/Studio/Provider/SelfHosted/ModelsResponse.cs
@ -2,4 +2,6 @@ namespace AIStudio.Provider.SelfHosted;

 public readonly record struct ModelsResponse(string? Object, Model[]? Data);

-public readonly record struct Model(string Id, string? Object, string? OwnedBy);
+public readonly record struct Model(string Id, string? Object, string? OwnedBy, ModelArchitecture? Architecture);
+
+public readonly record struct ModelArchitecture(string[]? InputModalities, string[]? OutputModalities);
--- a/Studio/Provider/SelfHosted/ProviderSelfHosted.cs
+++ b/Studio/Provider/SelfHosted/ProviderSelfHosted.cs
@ -95,7 +95,7 @@ public sealed class ProviderSelfHosted(Host host, string hostname) : BaseProvide
            switch (host)
            {
                case Host.LLAMA_CPP:
-                    return await this.LoadLlamaCppTextModels(token, apiKeyProvisional);
+                    return await this.LoadLlamaCppTextModels(["embed"], [], token, apiKeyProvisional);
            
                case Host.LM_STUDIO:
                case Host.OLLAMA:
@ -208,7 +208,7 @@ public sealed class ProviderSelfHosted(Host host, string hostname) : BaseProvide
        if (host is not Host.LLAMA_CPP || !chatModel.IsSystemModel)
            return chatModel;

-        var modelLoadResult = await this.LoadLlamaCppTextModels(token);
+        var modelLoadResult = await this.LoadLlamaCppTextModels(["embed"], [], token);
        if (!modelLoadResult.Success)
            return chatModel;

@ -216,20 +216,36 @@ public sealed class ProviderSelfHosted(Host host, string hostname) : BaseProvide
            .Where(model => !model.IsSystemModel && !string.IsNullOrWhiteSpace(model.Id))
            .ToList();

+        if (modelLoadResult.Models.All(model => !model.IsSystemModel) && availableModels.Count is 0)
+        {
+            LOGGER.LogError("The llama.cpp provider '{ProviderInstanceName}' does not offer a usable text model. Please check your provider settings.", this.InstanceName);
+            throw new ProviderRequestException(
+                ProviderRequestFailureReason.NONE,
+                string.Format(
+                    TB("The llama.cpp provider '{0}' does not offer a usable text model. Please check your provider settings."),
+                    this.InstanceName));
+        }
+
        if (availableModels.Count is 1)
            return availableModels[0];

        if (availableModels.Count > 1)
+        {
+            LOGGER.LogError(
+                "The llama.cpp provider '{ProviderInstanceName}' offers {ModelCount} models, but the configured model is the legacy system placeholder. The provider settings must be updated to select a specific model.",
+                this.InstanceName,
+                availableModels.Count);
            throw new ProviderRequestException(
                ProviderRequestFailureReason.NONE,
                string.Format(
                    TB("The llama.cpp provider '{0}' offers multiple models. Please open the provider settings and select the model to use."),
                    this.InstanceName));
+        }

        return chatModel;
    }

-    private async Task<ModelLoadResult> LoadLlamaCppTextModels(CancellationToken token, string? apiKeyProvisional = null)
+    private async Task<ModelLoadResult> LoadLlamaCppTextModels(string[] ignorePhrases, string[] filterPhrases, CancellationToken token, string? apiKeyProvisional = null)
    {
        var secretKey = await this.GetModelLoadingSecretKey(SecretStoreType.LLM_PROVIDER, apiKeyProvisional, true);

@ -253,12 +269,19 @@ public sealed class ProviderSelfHosted(Host host, string hostname) : BaseProvide
            try
            {
                var modelResponse = JsonSerializer.Deserialize<ModelsResponse>(responseBody, JSON_SERIALIZER_OPTIONS);
-                var models = modelResponse.Data?
+                var responseModels = modelResponse.Data?
                    .Where(model => !string.IsNullOrWhiteSpace(model.Id))
-                    .Select(model => new Provider.Model(model.Id, null))
                    .ToList() ?? [];

-                return models.Count is 0 ? LlamaCppLegacyModelResult() : SuccessfulModelLoadResult(models);
+                if (responseModels.Count is 0)
+                    return LlamaCppLegacyModelResult();
+
+                var models = responseModels
+                    .Where(model => IsMatchingLlamaCppTextModel(model, ignorePhrases, filterPhrases))
+                    .Select(model => new Provider.Model(model.Id, null))
+                    .ToList();
+
+                return SuccessfulModelLoadResult(models);
            }
            catch (JsonException e)
            {
@ -279,6 +302,25 @@ public sealed class ProviderSelfHosted(Host host, string hostname) : BaseProvide
        }
    }

+    private static bool IsMatchingLlamaCppTextModel(Model model, string[] ignorePhrases, string[] filterPhrases)
+    {
+        if (string.IsNullOrWhiteSpace(model.Id))
+            return false;
+
+        if (ignorePhrases.Any(ignorePhrase => model.Id.Contains(ignorePhrase, StringComparison.InvariantCultureIgnoreCase)))
+            return false;
+
+        if (!filterPhrases.All(filter => model.Id.Contains(filter, StringComparison.InvariantCultureIgnoreCase)))
+            return false;
+
+        var outputModalities = model.Architecture?.OutputModalities;
+        if (outputModalities is { Length: > 0 } &&
+            !outputModalities.Any(modality => string.Equals(modality, "text", StringComparison.OrdinalIgnoreCase)))
+            return false;
+
+        return true;
+    }
+
    private static ModelLoadResult LlamaCppLegacyModelResult()
    {
        return ModelLoadResult.FromModels([ AIStudio.Provider.Model.SYSTEM_MODEL ]);