refactor(executor): resolve upstream model at conductor level before execution

2026-02-18 04:10:51 +08:00 · 2025-12-30 19:31:54 +08:00
parent b055e00c1a
commit 96340bf136
12 changed files with 341 additions and 432 deletions
--- a/internal/runtime/executor/gemini_cli_executor.go
+++ b/internal/runtime/executor/gemini_cli_executor.go
@@ -75,21 +75,16 @@ func (e *GeminiCLIExecutor) Execute(ctx context.Context, auth *cliproxyauth.Auth
 	reporter := newUsageReporter(ctx, e.Identifier(), req.Model, auth)
 	defer reporter.trackFailure(ctx, &err)

-	upstreamModel := strings.TrimSpace(util.ResolveOriginalModel(req.Model, req.Metadata))
-	if upstreamModel == "" {
-		upstreamModel = strings.TrimSpace(req.Model)
-	}
-
 	from := opts.SourceFormat
 	to := sdktranslator.FromString("gemini-cli")
-	basePayload := sdktranslator.TranslateRequest(from, to, upstreamModel, bytes.Clone(req.Payload), false)
-	basePayload = applyThinkingMetadataCLI(basePayload, req.Metadata, upstreamModel)
-	basePayload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(upstreamModel, req.Metadata, basePayload)
-	basePayload = util.ApplyDefaultThinkingIfNeededCLI(upstreamModel, basePayload)
-	basePayload = util.NormalizeGeminiCLIThinkingBudget(upstreamModel, basePayload)
-	basePayload = util.StripThinkingConfigIfUnsupported(upstreamModel, basePayload)
-	basePayload = fixGeminiCLIImageAspectRatio(upstreamModel, basePayload)
-	basePayload = applyPayloadConfigWithRoot(e.cfg, upstreamModel, "gemini", "request", basePayload)
+	basePayload := sdktranslator.TranslateRequest(from, to, req.Model, bytes.Clone(req.Payload), false)
+	basePayload = applyThinkingMetadataCLI(basePayload, req.Metadata, req.Model)
+	basePayload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(req.Model, req.Metadata, basePayload)
+	basePayload = util.ApplyDefaultThinkingIfNeededCLI(req.Model, basePayload)
+	basePayload = util.NormalizeGeminiCLIThinkingBudget(req.Model, basePayload)
+	basePayload = util.StripThinkingConfigIfUnsupported(req.Model, basePayload)
+	basePayload = fixGeminiCLIImageAspectRatio(req.Model, basePayload)
+	basePayload = applyPayloadConfigWithRoot(e.cfg, req.Model, "gemini", "request", basePayload)

 	action := "generateContent"
 	if req.Metadata != nil {
@@ -99,9 +94,9 @@ func (e *GeminiCLIExecutor) Execute(ctx context.Context, auth *cliproxyauth.Auth
 	}

 	projectID := resolveGeminiProjectID(auth)
-	models := cliPreviewFallbackOrder(upstreamModel)
-	if len(models) == 0 || models[0] != upstreamModel {
-		models = append([]string{upstreamModel}, models...)
+	models := cliPreviewFallbackOrder(req.Model)
+	if len(models) == 0 || models[0] != req.Model {
+		models = append([]string{req.Model}, models...)
 	}

 	httpClient := newHTTPClient(ctx, e.cfg, auth, 0)
@@ -115,10 +110,6 @@ func (e *GeminiCLIExecutor) Execute(ctx context.Context, auth *cliproxyauth.Auth
 	var lastStatus int
 	var lastBody []byte

-	// NOTE: Model capability checks (thinking config, payload rules, image fixes, etc.) must be
-	// based on upstreamModel (resolved via oauth-model-mappings). The loop variable attemptModel
-	// is only used as the concrete model id sent to the upstream Gemini CLI endpoint (and the
-	// model label passed into response translation) when iterating fallback variants.
 	for idx, attemptModel := range models {
 		payload := append([]byte(nil), basePayload...)
 		if action == "countTokens" {
@@ -223,27 +214,22 @@ func (e *GeminiCLIExecutor) ExecuteStream(ctx context.Context, auth *cliproxyaut
 	reporter := newUsageReporter(ctx, e.Identifier(), req.Model, auth)
 	defer reporter.trackFailure(ctx, &err)

-	upstreamModel := strings.TrimSpace(util.ResolveOriginalModel(req.Model, req.Metadata))
-	if upstreamModel == "" {
-		upstreamModel = strings.TrimSpace(req.Model)
-	}
-
 	from := opts.SourceFormat
 	to := sdktranslator.FromString("gemini-cli")
-	basePayload := sdktranslator.TranslateRequest(from, to, upstreamModel, bytes.Clone(req.Payload), true)
-	basePayload = applyThinkingMetadataCLI(basePayload, req.Metadata, upstreamModel)
-	basePayload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(upstreamModel, req.Metadata, basePayload)
-	basePayload = util.ApplyDefaultThinkingIfNeededCLI(upstreamModel, basePayload)
-	basePayload = util.NormalizeGeminiCLIThinkingBudget(upstreamModel, basePayload)
-	basePayload = util.StripThinkingConfigIfUnsupported(upstreamModel, basePayload)
-	basePayload = fixGeminiCLIImageAspectRatio(upstreamModel, basePayload)
-	basePayload = applyPayloadConfigWithRoot(e.cfg, upstreamModel, "gemini", "request", basePayload)
+	basePayload := sdktranslator.TranslateRequest(from, to, req.Model, bytes.Clone(req.Payload), true)
+	basePayload = applyThinkingMetadataCLI(basePayload, req.Metadata, req.Model)
+	basePayload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(req.Model, req.Metadata, basePayload)
+	basePayload = util.ApplyDefaultThinkingIfNeededCLI(req.Model, basePayload)
+	basePayload = util.NormalizeGeminiCLIThinkingBudget(req.Model, basePayload)
+	basePayload = util.StripThinkingConfigIfUnsupported(req.Model, basePayload)
+	basePayload = fixGeminiCLIImageAspectRatio(req.Model, basePayload)
+	basePayload = applyPayloadConfigWithRoot(e.cfg, req.Model, "gemini", "request", basePayload)

 	projectID := resolveGeminiProjectID(auth)

-	models := cliPreviewFallbackOrder(upstreamModel)
-	if len(models) == 0 || models[0] != upstreamModel {
-		models = append([]string{upstreamModel}, models...)
+	models := cliPreviewFallbackOrder(req.Model)
+	if len(models) == 0 || models[0] != req.Model {
+		models = append([]string{req.Model}, models...)
 	}

 	httpClient := newHTTPClient(ctx, e.cfg, auth, 0)
@@ -257,10 +243,6 @@ func (e *GeminiCLIExecutor) ExecuteStream(ctx context.Context, auth *cliproxyaut
 	var lastStatus int
 	var lastBody []byte

-	// NOTE: Model capability checks (thinking config, payload rules, image fixes, etc.) must be
-	// based on upstreamModel (resolved via oauth-model-mappings). The loop variable attemptModel
-	// is only used as the concrete model id sent to the upstream Gemini CLI endpoint (and the
-	// model label passed into response translation) when iterating fallback variants.
 	for idx, attemptModel := range models {
 		payload := append([]byte(nil), basePayload...)
 		payload = setJSONField(payload, "project", projectID)
@@ -417,14 +399,9 @@ func (e *GeminiCLIExecutor) CountTokens(ctx context.Context, auth *cliproxyauth.
 	from := opts.SourceFormat
 	to := sdktranslator.FromString("gemini-cli")

-	upstreamModel := strings.TrimSpace(util.ResolveOriginalModel(req.Model, req.Metadata))
-	if upstreamModel == "" {
-		upstreamModel = strings.TrimSpace(req.Model)
-	}
-
-	models := cliPreviewFallbackOrder(upstreamModel)
-	if len(models) == 0 || models[0] != upstreamModel {
-		models = append([]string{upstreamModel}, models...)
+	models := cliPreviewFallbackOrder(req.Model)
+	if len(models) == 0 || models[0] != req.Model {
+		models = append([]string{req.Model}, models...)
 	}

 	httpClient := newHTTPClient(ctx, e.cfg, auth, 0)
@@ -440,19 +417,17 @@ func (e *GeminiCLIExecutor) CountTokens(ctx context.Context, auth *cliproxyauth.
 	var lastStatus int
 	var lastBody []byte

-	// NOTE: Model capability checks (thinking config, payload rules, image fixes, etc.) must be
-	// based on upstreamModel (resolved via oauth-model-mappings). The loop variable attemptModel
-	// is only used as the concrete model id sent to the upstream Gemini CLI endpoint when iterating
-	// fallback variants.
+	// The loop variable attemptModel is only used as the concrete model id sent to the upstream
+	// Gemini CLI endpoint when iterating fallback variants.
 	for _, attemptModel := range models {
 		payload := sdktranslator.TranslateRequest(from, to, attemptModel, bytes.Clone(req.Payload), false)
-		payload = applyThinkingMetadataCLI(payload, req.Metadata, upstreamModel)
-		payload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(upstreamModel, req.Metadata, payload)
+		payload = applyThinkingMetadataCLI(payload, req.Metadata, req.Model)
+		payload = util.ApplyGemini3ThinkingLevelFromMetadataCLI(req.Model, req.Metadata, payload)
 		payload = deleteJSONField(payload, "project")
 		payload = deleteJSONField(payload, "model")
 		payload = deleteJSONField(payload, "request.safetySettings")
-		payload = util.StripThinkingConfigIfUnsupported(upstreamModel, payload)
-		payload = fixGeminiCLIImageAspectRatio(upstreamModel, payload)
+		payload = util.StripThinkingConfigIfUnsupported(req.Model, payload)
+		payload = fixGeminiCLIImageAspectRatio(req.Model, payload)

 		tok, errTok := tokenSource.Token()
 		if errTok != nil {