new-api/controller/relay-text.go

package controller

import (
	"bytes"
	"context"
	"encoding/json"
	"errors"
	"fmt"
	"io"
	"net/http"
	"one-api/common"
	"one-api/model"
	"strings"
	"time"

	"github.com/gin-gonic/gin"
)

const (
	APITypeOpenAI = iota
	APITypeClaude
	APITypePaLM
	APITypeBaidu
	APITypeZhipu
	APITypeAli
	APITypeXunfei
	APITypeAIProxyLibrary
	APITypeTencent
	APITypeGemini
)

var httpClient *http.Client
var impatientHTTPClient *http.Client

func init() {
	if common.RelayTimeout == 0 {
		httpClient = &http.Client{}
	} else {
		httpClient = &http.Client{
			Timeout: time.Duration(common.RelayTimeout) * time.Second,
		}
	}

	impatientHTTPClient = &http.Client{
		Timeout: 5 * time.Second,
	}
}

func relayTextHelper(c *gin.Context, relayMode int) *OpenAIErrorWithStatusCode {
	channelType := c.GetInt("channel")
	channelId := c.GetInt("channel_id")
	tokenId := c.GetInt("token_id")
	userId := c.GetInt("id")
	group := c.GetString("group")
	tokenUnlimited := c.GetBool("token_unlimited_quota")
	startTime := time.Now()
	var textRequest GeneralOpenAIRequest

	err := common.UnmarshalBodyReusable(c, &textRequest)
	if err != nil {
		return errorWrapper(err, "bind_request_body_failed", http.StatusBadRequest)
	}
	if relayMode == RelayModeModerations && textRequest.Model == "" {
		textRequest.Model = "text-moderation-latest"
	}
	if relayMode == RelayModeEmbeddings && textRequest.Model == "" {
		textRequest.Model = c.Param("model")
	}
	// request validation
	if textRequest.Model == "" {
		return errorWrapper(errors.New("model is required"), "required_field_missing", http.StatusBadRequest)
	}
	switch relayMode {
	case RelayModeCompletions:
		if textRequest.Prompt == "" {
			return errorWrapper(errors.New("field prompt is required"), "required_field_missing", http.StatusBadRequest)
		}
	case RelayModeChatCompletions:
		if textRequest.Messages == nil || len(textRequest.Messages) == 0 {
			return errorWrapper(errors.New("field messages is required"), "required_field_missing", http.StatusBadRequest)
		}
	case RelayModeEmbeddings:
	case RelayModeModerations:
		if textRequest.Input == "" {
			return errorWrapper(errors.New("field input is required"), "required_field_missing", http.StatusBadRequest)
		}
	case RelayModeEdits:
		if textRequest.Instruction == "" {
			return errorWrapper(errors.New("field instruction is required"), "required_field_missing", http.StatusBadRequest)
		}
	}
	// map model name
	modelMapping := c.GetString("model_mapping")
	isModelMapped := false
	if modelMapping != "" && modelMapping != "{}" {
		modelMap := make(map[string]string)
		err := json.Unmarshal([]byte(modelMapping), &modelMap)
		if err != nil {
			return errorWrapper(err, "unmarshal_model_mapping_failed", http.StatusInternalServerError)
		}
		if modelMap[textRequest.Model] != "" {
			textRequest.Model = modelMap[textRequest.Model]
			isModelMapped = true
		}
	}
	apiType := APITypeOpenAI
	switch channelType {
	case common.ChannelTypeAnthropic:
		apiType = APITypeClaude
	case common.ChannelTypeBaidu:
		apiType = APITypeBaidu
	case common.ChannelTypePaLM:
		apiType = APITypePaLM
	case common.ChannelTypeZhipu:
		apiType = APITypeZhipu
	case common.ChannelTypeAli:
		apiType = APITypeAli
	case common.ChannelTypeXunfei:
		apiType = APITypeXunfei
	case common.ChannelTypeAIProxyLibrary:
		apiType = APITypeAIProxyLibrary
	case common.ChannelTypeTencent:
		apiType = APITypeTencent
	case common.ChannelTypeGemini:
		apiType = APITypeGemini
	}
	baseURL := common.ChannelBaseURLs[channelType]
	requestURL := c.Request.URL.String()
	if c.GetString("base_url") != "" {
		baseURL = c.GetString("base_url")
	}
	fullRequestURL := getFullRequestURL(baseURL, requestURL, channelType)
	switch apiType {
	case APITypeOpenAI:
		if channelType == common.ChannelTypeAzure {
			// https://learn.microsoft.com/en-us/azure/cognitive-services/openai/chatgpt-quickstart?pivots=rest-api&tabs=command-line#rest-api
			query := c.Request.URL.Query()
			apiVersion := query.Get("api-version")
			if apiVersion == "" {
				apiVersion = c.GetString("api_version")
			}
			requestURL := strings.Split(requestURL, "?")[0]
			requestURL = fmt.Sprintf("%s?api-version=%s", requestURL, apiVersion)
			baseURL = c.GetString("base_url")
			task := strings.TrimPrefix(requestURL, "/v1/")
			model_ := textRequest.Model
			model_ = strings.Replace(model_, ".", "", -1)
			// https://github.com/songquanpeng/one-api/issues/67
			model_ = strings.TrimSuffix(model_, "-0301")
			model_ = strings.TrimSuffix(model_, "-0314")
			model_ = strings.TrimSuffix(model_, "-0613")
			fullRequestURL = fmt.Sprintf("%s/openai/deployments/%s/%s", baseURL, model_, task)
		}
	case APITypeClaude:
		fullRequestURL = "https://api.anthropic.com/v1/complete"
		if baseURL != "" {
			fullRequestURL = fmt.Sprintf("%s/v1/complete", baseURL)
		}
	case APITypeBaidu:
		switch textRequest.Model {
		case "ERNIE-Bot":
			fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions"
		case "ERNIE-Bot-turbo":
			fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant"
		case "ERNIE-Bot-4":
			fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro"
		case "BLOOMZ-7B":
			fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/bloomz_7b1"
		case "Embedding-V1":
			fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/embedding-v1"
		}
		apiKey := c.Request.Header.Get("Authorization")
		apiKey = strings.TrimPrefix(apiKey, "Bearer ")
		var err error
		if apiKey, err = getBaiduAccessToken(apiKey); err != nil {
			return errorWrapper(err, "invalid_baidu_config", http.StatusInternalServerError)
		}
		fullRequestURL += "?access_token=" + apiKey
	case APITypePaLM:
		fullRequestURL = "https://generativelanguage.googleapis.com/v1beta2/models/chat-bison-001:generateMessage"
		if baseURL != "" {
			fullRequestURL = fmt.Sprintf("%s/v1beta2/models/chat-bison-001:generateMessage", baseURL)
		}
		apiKey := c.Request.Header.Get("Authorization")
		apiKey = strings.TrimPrefix(apiKey, "Bearer ")
		fullRequestURL += "?key=" + apiKey
	case APITypeGemini:
		requestBaseURL := "https://generativelanguage.googleapis.com"
		if baseURL != "" {
			requestBaseURL = baseURL
		}
		version := "v1beta"
		if c.GetString("api_version") != "" {
			version = c.GetString("api_version")
		}
		action := "generateContent"
		if textRequest.Stream {
			action = "streamGenerateContent"
		}
		fullRequestURL = fmt.Sprintf("%s/%s/models/%s:%s", requestBaseURL, version, textRequest.Model, action)
		apiKey := c.Request.Header.Get("Authorization")
		apiKey = strings.TrimPrefix(apiKey, "Bearer ")
		fullRequestURL += "?key=" + apiKey
		//log.Println(fullRequestURL)

	case APITypeZhipu:
		method := "invoke"
		if textRequest.Stream {
			method = "sse-invoke"
		}
		fullRequestURL = fmt.Sprintf("https://open.bigmodel.cn/api/paas/v3/model-api/%s/%s", textRequest.Model, method)
	case APITypeAli:
		fullRequestURL = "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation"
		if relayMode == RelayModeEmbeddings {
			fullRequestURL = "https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding"
		}
	case APITypeTencent:
		fullRequestURL = "https://hunyuan.cloud.tencent.com/hyllm/v1/chat/completions"
	case APITypeAIProxyLibrary:
		fullRequestURL = fmt.Sprintf("%s/api/library/ask", baseURL)
	}
	var promptTokens int
	var completionTokens int
	switch relayMode {
	case RelayModeChatCompletions:
		promptTokens, err = countTokenMessages(textRequest.Messages, textRequest.Model)
		if err != nil {
			return errorWrapper(err, "count_token_messages_failed", http.StatusInternalServerError)
		}
	case RelayModeCompletions:
		promptTokens = countTokenInput(textRequest.Prompt, textRequest.Model)
	case RelayModeModerations:
		promptTokens = countTokenInput(textRequest.Input, textRequest.Model)
	}
	modelPrice := common.GetModelPrice(textRequest.Model)
	groupRatio := common.GetGroupRatio(group)

	var preConsumedQuota int
	var ratio float64
	var modelRatio float64
	if modelPrice == -1 {
		preConsumedTokens := common.PreConsumedQuota
		if textRequest.MaxTokens != 0 {
			preConsumedTokens = promptTokens + int(textRequest.MaxTokens)
		}
		modelRatio = common.GetModelRatio(textRequest.Model)
		ratio = modelRatio * groupRatio
		preConsumedQuota = int(float64(preConsumedTokens) * ratio)
	} else {
		preConsumedQuota = int(modelPrice * common.QuotaPerUnit * groupRatio)
	}

	userQuota, err := model.CacheGetUserQuota(userId)
	if err != nil {
		return errorWrapper(err, "get_user_quota_failed", http.StatusInternalServerError)
	}
	if userQuota < 0 || userQuota-preConsumedQuota < 0 {
		return errorWrapper(errors.New("user quota is not enough"), "insufficient_user_quota", http.StatusForbidden)
	}
	err = model.CacheDecreaseUserQuota(userId, preConsumedQuota)
	if err != nil {
		return errorWrapper(err, "decrease_user_quota_failed", http.StatusInternalServerError)
	}
	if userQuota > 100*preConsumedQuota {
		// 用户额度充足，判断令牌额度是否充足
		if !tokenUnlimited {
			// 非无限令牌，判断令牌额度是否充足
			tokenQuota := c.GetInt("token_quota")
			if tokenQuota > 100*preConsumedQuota {
				// 令牌额度充足，信任令牌
				preConsumedQuota = 0
				common.LogInfo(c.Request.Context(), fmt.Sprintf("user %d quota %d and token %d quota %d are enough, trusted and no need to pre-consume", userId, userQuota, tokenId, tokenQuota))
			}
		} else {
			// in this case, we do not pre-consume quota
			// because the user has enough quota
			preConsumedQuota = 0
			common.LogInfo(c.Request.Context(), fmt.Sprintf("user %d with unlimited token has enough quota %d, trusted and no need to pre-consume", userId, userQuota))
		}
	}
	if preConsumedQuota > 0 {
		userQuota, err = model.PreConsumeTokenQuota(tokenId, preConsumedQuota)
		if err != nil {
			return errorWrapper(err, "pre_consume_token_quota_failed", http.StatusForbidden)
		}
	}
	var requestBody io.Reader
	if isModelMapped {
		jsonStr, err := json.Marshal(textRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	} else {
		requestBody = c.Request.Body
	}
	switch apiType {
	case APITypeClaude:
		claudeRequest := requestOpenAI2Claude(textRequest)
		jsonStr, err := json.Marshal(claudeRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeBaidu:
		var jsonData []byte
		var err error
		switch relayMode {
		case RelayModeEmbeddings:
			baiduEmbeddingRequest := embeddingRequestOpenAI2Baidu(textRequest)
			jsonData, err = json.Marshal(baiduEmbeddingRequest)
		default:
			baiduRequest := requestOpenAI2Baidu(textRequest)
			jsonData, err = json.Marshal(baiduRequest)
		}
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonData)
	case APITypePaLM:
		palmRequest := requestOpenAI2PaLM(textRequest)
		jsonStr, err := json.Marshal(palmRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeGemini:
		geminiChatRequest := requestOpenAI2Gemini(textRequest)
		jsonStr, err := json.Marshal(geminiChatRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeZhipu:
		zhipuRequest := requestOpenAI2Zhipu(textRequest)
		jsonStr, err := json.Marshal(zhipuRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeAli:
		var jsonStr []byte
		var err error
		switch relayMode {
		case RelayModeEmbeddings:
			aliEmbeddingRequest := embeddingRequestOpenAI2Ali(textRequest)
			jsonStr, err = json.Marshal(aliEmbeddingRequest)
		default:
			aliRequest := requestOpenAI2Ali(textRequest)
			jsonStr, err = json.Marshal(aliRequest)
		}
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeTencent:
		apiKey := c.Request.Header.Get("Authorization")
		apiKey = strings.TrimPrefix(apiKey, "Bearer ")
		appId, secretId, secretKey, err := parseTencentConfig(apiKey)
		if err != nil {
			return errorWrapper(err, "invalid_tencent_config", http.StatusInternalServerError)
		}
		tencentRequest := requestOpenAI2Tencent(textRequest)
		tencentRequest.AppId = appId
		tencentRequest.SecretId = secretId
		jsonStr, err := json.Marshal(tencentRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		sign := getTencentSign(*tencentRequest, secretKey)
		c.Request.Header.Set("Authorization", sign)
		requestBody = bytes.NewBuffer(jsonStr)
	case APITypeAIProxyLibrary:
		aiProxyLibraryRequest := requestOpenAI2AIProxyLibrary(textRequest)
		aiProxyLibraryRequest.LibraryId = c.GetString("library_id")
		jsonStr, err := json.Marshal(aiProxyLibraryRequest)
		if err != nil {
			return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
		}
		requestBody = bytes.NewBuffer(jsonStr)
	}

	var req *http.Request
	var resp *http.Response
	isStream := textRequest.Stream

	if apiType != APITypeXunfei { // cause xunfei use websocket
		req, err = http.NewRequest(c.Request.Method, fullRequestURL, requestBody)
		// 设置GetBody函数，该函数返回一个新的io.ReadCloser，该io.ReadCloser返回与原始请求体相同的数据
		req.GetBody = func() (io.ReadCloser, error) {
			return io.NopCloser(requestBody), nil
		}
		if err != nil {
			return errorWrapper(err, "new_request_failed", http.StatusInternalServerError)
		}
		apiKey := c.Request.Header.Get("Authorization")
		apiKey = strings.TrimPrefix(apiKey, "Bearer ")
		switch apiType {
		case APITypeOpenAI:
			if channelType == common.ChannelTypeAzure {
				req.Header.Set("api-key", apiKey)
			} else {
				req.Header.Set("Authorization", c.Request.Header.Get("Authorization"))
				if c.Request.Header.Get("OpenAI-Organization") != "" {
					req.Header.Set("OpenAI-Organization", c.Request.Header.Get("OpenAI-Organization"))
				}
				if channelType == common.ChannelTypeOpenRouter {
					req.Header.Set("HTTP-Referer", "https://github.com/songquanpeng/one-api")
					req.Header.Set("X-Title", "One API")
				}
			}
		case APITypeClaude:
			req.Header.Set("x-api-key", apiKey)
			anthropicVersion := c.Request.Header.Get("anthropic-version")
			if anthropicVersion == "" {
				anthropicVersion = "2023-06-01"
			}
			req.Header.Set("anthropic-version", anthropicVersion)
		case APITypeZhipu:
			token := getZhipuToken(apiKey)
			req.Header.Set("Authorization", token)
		case APITypeAli:
			req.Header.Set("Authorization", "Bearer "+apiKey)
			if textRequest.Stream {
				req.Header.Set("X-DashScope-SSE", "enable")
			}
		case APITypeTencent:
			req.Header.Set("Authorization", apiKey)
		case APITypeGemini:
			req.Header.Set("Content-Type", "application/json")
		default:
			req.Header.Set("Authorization", "Bearer "+apiKey)
		}
		if apiType != APITypeGemini {
			// 设置公共头部...
			req.Header.Set("Content-Type", c.Request.Header.Get("Content-Type"))
			req.Header.Set("Accept", c.Request.Header.Get("Accept"))
			if isStream && c.Request.Header.Get("Accept") == "" {
				req.Header.Set("Accept", "text/event-stream")
			}
		}
		//req.HeaderBar.Set("Connection", c.Request.HeaderBar.Get("Connection"))
		resp, err = httpClient.Do(req)
		if err != nil {
			return errorWrapper(err, "do_request_failed", http.StatusInternalServerError)
		}
		err = req.Body.Close()
		if err != nil {
			return errorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
		}
		err = c.Request.Body.Close()
		if err != nil {
			return errorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
		}
		isStream = isStream || strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")

		if resp.StatusCode != http.StatusOK {
			if preConsumedQuota != 0 {
				go func(ctx context.Context) {
					// return pre-consumed quota
					err := model.PostConsumeTokenQuota(tokenId, userQuota, -preConsumedQuota, 0, false)
					if err != nil {
						common.LogError(ctx, "error return pre-consumed quota: "+err.Error())
					}
				}(c.Request.Context())
			}
			return relayErrorHandler(resp)
		}
	}

	var textResponse TextResponse
	tokenName := c.GetString("token_name")

	defer func(ctx context.Context) {
		// c.Writer.Flush()
		go func() {
			promptTokens = textResponse.Usage.PromptTokens
			completionTokens = textResponse.Usage.CompletionTokens

			quota := 0
			if modelPrice == -1 {
				completionRatio := common.GetCompletionRatio(textRequest.Model)
				quota = promptTokens + int(float64(completionTokens)*completionRatio)
				quota = int(float64(quota) * ratio)
				if ratio != 0 && quota <= 0 {
					quota = 1
				}
			} else {
				quota = int(modelPrice * common.QuotaPerUnit * groupRatio)
			}
			totalTokens := promptTokens + completionTokens
			if totalTokens == 0 {
				// in this case, must be some error happened
				// we cannot just return, because we may have to return the pre-consumed quota
				quota = 0
			}
			quotaDelta := quota - preConsumedQuota
			err := model.PostConsumeTokenQuota(tokenId, userQuota, quotaDelta, preConsumedQuota, true)
			if err != nil {
				common.LogError(ctx, "error consuming token remain quota: "+err.Error())
			}
			err = model.CacheUpdateUserQuota(userId)
			if err != nil {
				common.LogError(ctx, "error update user quota cache: "+err.Error())
			}

			// record all the consume log even if quota is 0
			useTimeSeconds := time.Now().Unix() - startTime.Unix()
			var logContent string
			if modelPrice == -1 {
				logContent = fmt.Sprintf("模型倍率 %.2f，分组倍率 %.2f，用时 %d秒", modelRatio, groupRatio, useTimeSeconds)
			} else {
				logContent = fmt.Sprintf("模型价格 %.2f，分组倍率 %.2f，用时 %d秒", modelPrice, groupRatio, useTimeSeconds)
			}
			logModel := textRequest.Model
			if strings.HasPrefix(logModel, "gpt-4-gizmo") {
				logModel = "gpt-4-gizmo-*"
				logContent += fmt.Sprintf("，模型 %s", textRequest.Model)
			}

			model.RecordConsumeLog(ctx, userId, channelId, promptTokens, completionTokens, logModel, tokenName, quota, logContent, tokenId, userQuota)
			model.UpdateUserUsedQuotaAndRequestCount(userId, quota)
			model.UpdateChannelUsedQuota(channelId, quota)
			//if quota != 0 {
			//
			//}
		}()
	}(c.Request.Context())
	switch apiType {
	case APITypeOpenAI:
		if isStream {
			err, responseText := openaiStreamHandler(c, resp, relayMode)
			if err != nil {
				return err
			}
			textResponse.Usage.PromptTokens = promptTokens
			textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
			return nil
		} else {
			err, usage := openaiHandler(c, resp, promptTokens, textRequest.Model)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeClaude:
		if isStream {
			err, responseText := claudeStreamHandler(c, resp)
			if err != nil {
				return err
			}
			textResponse.Usage.PromptTokens = promptTokens
			textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
			return nil
		} else {
			err, usage := claudeHandler(c, resp, promptTokens, textRequest.Model)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeBaidu:
		if isStream {
			err, usage := baiduStreamHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		} else {
			var err *OpenAIErrorWithStatusCode
			var usage *Usage
			switch relayMode {
			case RelayModeEmbeddings:
				err, usage = baiduEmbeddingHandler(c, resp)
			default:
				err, usage = baiduHandler(c, resp)
			}
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypePaLM:
		if textRequest.Stream { // PaLM2 API does not support stream
			err, responseText := palmStreamHandler(c, resp)
			if err != nil {
				return err
			}
			textResponse.Usage.PromptTokens = promptTokens
			textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
			return nil
		} else {
			err, usage := palmHandler(c, resp, promptTokens, textRequest.Model)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeGemini:
		if textRequest.Stream {
			err, responseText := geminiChatStreamHandler(c, resp)
			if err != nil {
				return err
			}
			textResponse.Usage.PromptTokens = promptTokens
			textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
			return nil
		} else {
			err, usage := geminiChatHandler(c, resp, promptTokens, textRequest.Model)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeZhipu:
		if isStream {
			err, usage := zhipuStreamHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			// zhipu's API does not return prompt tokens & completion tokens
			textResponse.Usage.PromptTokens = textResponse.Usage.TotalTokens
			return nil
		} else {
			err, usage := zhipuHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			// zhipu's API does not return prompt tokens & completion tokens
			textResponse.Usage.PromptTokens = textResponse.Usage.TotalTokens
			return nil
		}
	case APITypeAli:
		if isStream {
			err, usage := aliStreamHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		} else {
			var err *OpenAIErrorWithStatusCode
			var usage *Usage
			switch relayMode {
			case RelayModeEmbeddings:
				err, usage = aliEmbeddingHandler(c, resp)
			default:
				err, usage = aliHandler(c, resp)
			}
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeXunfei:
		auth := c.Request.Header.Get("Authorization")
		auth = strings.TrimPrefix(auth, "Bearer ")
		splits := strings.Split(auth, "|")
		if len(splits) != 3 {
			return errorWrapper(errors.New("invalid auth"), "invalid_auth", http.StatusBadRequest)
		}
		var err *OpenAIErrorWithStatusCode
		var usage *Usage
		if isStream {
			err, usage = xunfeiStreamHandler(c, textRequest, splits[0], splits[1], splits[2])
		} else {
			err, usage = xunfeiHandler(c, textRequest, splits[0], splits[1], splits[2])
		}
		if err != nil {
			return err
		}
		if usage != nil {
			textResponse.Usage = *usage
		}
		return nil
	case APITypeAIProxyLibrary:
		if isStream {
			err, usage := aiProxyLibraryStreamHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		} else {
			err, usage := aiProxyLibraryHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	case APITypeTencent:
		if isStream {
			err, responseText := tencentStreamHandler(c, resp)
			if err != nil {
				return err
			}
			textResponse.Usage.PromptTokens = promptTokens
			textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
			return nil
		} else {
			err, usage := tencentHandler(c, resp)
			if err != nil {
				return err
			}
			if usage != nil {
				textResponse.Usage = *usage
			}
			return nil
		}
	default:
		return errorWrapper(errors.New("unknown api type"), "unknown_api_type", http.StatusInternalServerError)
	}
}
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+								package controller
 								import (
 									"bytes"
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+									"context"
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									"encoding/json"
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+									"errors"
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									"fmt"
 									"io"
 									"net/http"
 									"one-api/common"
 									"one-api/model"
 									"strings"
-												feat:  able to refresh baidu access token automatically (#400, close #401)

* feat:baidu channel support apiKey and secretKey

添加百度文心渠道时支持填写secretKey|apiKey或者accessToken，支持自动刷新accessToken

* fix

* fix

* fix

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-08-12 23:41:44 +08:00
+									"time"
-												fix: set Accept header if not given (#615)

* fix: fastgpt调用通义千问问答失败

* refactor: Dockerfile

* Revert "refactor: Dockerfile"

This reverts commit a538c4f28eaf4dee66df3b4d951a3dc29d4db9ec.

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
											
										
										
											2023-10-22 17:56:20 +08:00
 									"github.com/gin-gonic/gin"
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+								)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+								const (
 									APITypeOpenAI = iota
 									APITypeClaude
 									APITypePaLM
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+									APITypeBaidu
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+									APITypeZhipu
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+									APITypeAli
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+									APITypeXunfei
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+									APITypeAIProxyLibrary
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+									APITypeTencent
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+									APITypeGemini
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+								)
-												perf: reuse http client to reduce delay

											
										
										
											2023-07-23 15:18:58 +08:00
+								var httpClient *http.Client
-												feat:  able to refresh baidu access token automatically (#400, close #401)

* feat:baidu channel support apiKey and secretKey

添加百度文心渠道时支持填写secretKey|apiKey或者accessToken，支持自动刷新accessToken

* fix

* fix

* fix

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-08-12 23:41:44 +08:00
+								var impatientHTTPClient *http.Client
-												perf: reuse http client to reduce delay

											
										
										
											2023-07-23 15:18:58 +08:00
 								func init() {
-												feat: able to set RELAY_TIMEOUT

											
										
										
											2023-10-22 20:39:49 +08:00
+									if common.RelayTimeout == 0 {
 										httpClient = &http.Client{}
 									} else {
 										httpClient = &http.Client{
 											Timeout: time.Duration(common.RelayTimeout) * time.Second,
 										}
 									}
-												feat:  able to refresh baidu access token automatically (#400, close #401)

* feat:baidu channel support apiKey and secretKey

添加百度文心渠道时支持填写secretKey|apiKey或者accessToken，支持自动刷新accessToken

* fix

* fix

* fix

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-08-12 23:41:44 +08:00
+									impatientHTTPClient = &http.Client{
 										Timeout: 5 * time.Second,
 									}
-												perf: reuse http client to reduce delay

											
										
										
											2023-07-23 15:18:58 +08:00
+								}
-												refactor: rename function

											
										
										
											2023-06-19 15:00:22 +08:00
+								func relayTextHelper(c *gin.Context, relayMode int) *OpenAIErrorWithStatusCode {
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									channelType := c.GetInt("channel")
-												feat: supprt channel priority now & record channel id in log (#484)

* feat: 支持设置渠道优先级 & 日志中显示使用的渠道ID

* fix: 设置渠道优先级未更新 ability

* chore: update implementation

---------

Co-authored-by: Xiangyuan Liu <xiangyuan.liu@ui.com>
Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-09-17 19:18:16 +08:00
+									channelId := c.GetInt("channel_id")
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									tokenId := c.GetInt("token_id")
-												feat: do not access database before response return (close #158)

											
										
										
											2023-06-21 17:26:26 +08:00
+									userId := c.GetInt("id")
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									group := c.GetString("group")
-												fix: 完善令牌预扣费逻辑

											
										
										
											2024-01-11 14:12:38 +08:00
+									tokenUnlimited := c.GetBool("token_unlimited_quota")
-												record relay time

											
										
										
											2023-11-23 03:06:04 +08:00
+									startTime := time.Now()
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									var textRequest GeneralOpenAIRequest
-												record relay time

											
										
										
											2023-11-23 03:06:04 +08:00
 									err := common.UnmarshalBodyReusable(c, &textRequest)
 									if err != nil {
 										return errorWrapper(err, "bind_request_body_failed", http.StatusBadRequest)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									}
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+									if relayMode == RelayModeModerations && textRequest.Model == "" {
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										textRequest.Model = "text-moderation-latest"
 									}
-												feat: add support for /v1/engines/text-embedding-ada-002/embeddings (#224, close #222)


											
										
										
											2023-07-15 12:03:23 +08:00
+									if relayMode == RelayModeEmbeddings && textRequest.Model == "" {
 										textRequest.Model = c.Param("model")
 									}
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+									// request validation
 									if textRequest.Model == "" {
 										return errorWrapper(errors.New("model is required"), "required_field_missing", http.StatusBadRequest)
 									}
 									switch relayMode {
 									case RelayModeCompletions:
 										if textRequest.Prompt == "" {
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+											return errorWrapper(errors.New("field prompt is required"), "required_field_missing", http.StatusBadRequest)
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+										}
 									case RelayModeChatCompletions:
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+										if textRequest.Messages == nil || len(textRequest.Messages) == 0 {
 											return errorWrapper(errors.New("field messages is required"), "required_field_missing", http.StatusBadRequest)
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+										}
 									case RelayModeEmbeddings:
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+									case RelayModeModerations:
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+										if textRequest.Input == "" {
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+											return errorWrapper(errors.New("field input is required"), "required_field_missing", http.StatusBadRequest)
 										}
 									case RelayModeEdits:
 										if textRequest.Instruction == "" {
 											return errorWrapper(errors.New("field instruction is required"), "required_field_missing", http.StatusBadRequest)
-												perf: validate the request first before send to OpenAI's server

											
										
										
											2023-06-25 10:25:33 +08:00
+										}
 									}
-												feat: support model remap now

											
										
										
											2023-06-27 13:42:45 +08:00
+									// map model name
 									modelMapping := c.GetString("model_mapping")
 									isModelMapped := false
-												fix: fix model mapping cannot be deleted

											
										
										
											2023-07-29 19:17:26 +08:00
+									if modelMapping != "" && modelMapping != "{}" {
-												feat: support model remap now

											
										
										
											2023-06-27 13:42:45 +08:00
+										modelMap := make(map[string]string)
 										err := json.Unmarshal([]byte(modelMapping), &modelMap)
 										if err != nil {
 											return errorWrapper(err, "unmarshal_model_mapping_failed", http.StatusInternalServerError)
 										}
 										if modelMap[textRequest.Model] != "" {
 											textRequest.Model = modelMap[textRequest.Model]
 											isModelMapped = true
 										}
 									}
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									apiType := APITypeOpenAI
-												fix: use channel type to determine api type (close #321)

											
										
										
											2023-07-24 23:34:14 +08:00
+									switch channelType {
 									case common.ChannelTypeAnthropic:
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+										apiType = APITypeClaude
-												fix: use channel type to determine api type (close #321)

											
										
										
											2023-07-24 23:34:14 +08:00
+									case common.ChannelTypeBaidu:
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+										apiType = APITypeBaidu
-												fix: use channel type to determine api type (close #321)

											
										
										
											2023-07-24 23:34:14 +08:00
+									case common.ChannelTypePaLM:
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+										apiType = APITypePaLM
-												fix: use channel type to determine api type (close #321)

											
										
										
											2023-07-24 23:34:14 +08:00
+									case common.ChannelTypeZhipu:
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+										apiType = APITypeZhipu
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+									case common.ChannelTypeAli:
 										apiType = APITypeAli
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+									case common.ChannelTypeXunfei:
 										apiType = APITypeXunfei
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+									case common.ChannelTypeAIProxyLibrary:
 										apiType = APITypeAIProxyLibrary
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+									case common.ChannelTypeTencent:
 										apiType = APITypeTencent
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+									case common.ChannelTypeGemini:
 										apiType = APITypeGemini
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									}
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									baseURL := common.ChannelBaseURLs[channelType]
 									requestURL := c.Request.URL.String()
-												feat: support custom base url for channels

											
										
										
											2023-06-20 22:32:56 +08:00
+									if c.GetString("base_url") != "" {
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										baseURL = c.GetString("base_url")
 									}
-												feat: add cloudflare ai gateway support for image & audio (#607)

* Update channel-test.go

* Update relay-audio.go

* Update relay-image.go

* chore: using a util function

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
											
										
										
											2023-10-22 17:50:52 +08:00
+									fullRequestURL := getFullRequestURL(baseURL, requestURL, channelType)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									switch apiType {
 									case APITypeOpenAI:
 										if channelType == common.ChannelTypeAzure {
 											// https://learn.microsoft.com/en-us/azure/cognitive-services/openai/chatgpt-quickstart?pivots=rest-api&tabs=command-line#rest-api
 											query := c.Request.URL.Query()
 											apiVersion := query.Get("api-version")
 											if apiVersion == "" {
 												apiVersion = c.GetString("api_version")
 											}
 											requestURL := strings.Split(requestURL, "?")[0]
 											requestURL = fmt.Sprintf("%s?api-version=%s", requestURL, apiVersion)
 											baseURL = c.GetString("base_url")
 											task := strings.TrimPrefix(requestURL, "/v1/")
 											model_ := textRequest.Model
 											model_ = strings.Replace(model_, ".", "", -1)
 											// https://github.com/songquanpeng/one-api/issues/67
 											model_ = strings.TrimSuffix(model_, "-0301")
 											model_ = strings.TrimSuffix(model_, "-0314")
 											model_ = strings.TrimSuffix(model_, "-0613")
 											fullRequestURL = fmt.Sprintf("%s/openai/deployments/%s/%s", baseURL, model_, task)
 										}
 									case APITypeClaude:
 										fullRequestURL = "https://api.anthropic.com/v1/complete"
 										if baseURL != "" {
 											fullRequestURL = fmt.Sprintf("%s/v1/complete", baseURL)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+									case APITypeBaidu:
 										switch textRequest.Model {
 										case "ERNIE-Bot":
 											fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions"
 										case "ERNIE-Bot-turbo":
 											fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant"
-												feat: support ERNIE-Bot-4 (close #608)

											
										
										
											2023-10-22 18:48:35 +08:00
+										case "ERNIE-Bot-4":
 											fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro"
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+										case "BLOOMZ-7B":
 											fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/bloomz_7b1"
-												feat: support baidu's embedding model (close #324)

											
										
										
											2023-07-29 12:15:07 +08:00
+										case "Embedding-V1":
 											fullRequestURL = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/embedding-v1"
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+										}
 										apiKey := c.Request.Header.Get("Authorization")
 										apiKey = strings.TrimPrefix(apiKey, "Bearer ")
-												feat:  able to refresh baidu access token automatically (#400, close #401)

* feat:baidu channel support apiKey and secretKey

添加百度文心渠道时支持填写secretKey|apiKey或者accessToken，支持自动刷新accessToken

* fix

* fix

* fix

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-08-12 23:41:44 +08:00
+										var err error
 										if apiKey, err = getBaiduAccessToken(apiKey); err != nil {
 											return errorWrapper(err, "invalid_baidu_config", http.StatusInternalServerError)
 										}
 										fullRequestURL += "?access_token=" + apiKey
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+									case APITypePaLM:
 										fullRequestURL = "https://generativelanguage.googleapis.com/v1beta2/models/chat-bison-001:generateMessage"
-												fix: baseURL not working in APITypePaLM (#317)

* fix: baseURL not working in APITypePaLM

* chore: use the same logic as claude

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
											
										
										
											2023-07-24 22:37:57 +08:00
+										if baseURL != "" {
 											fullRequestURL = fmt.Sprintf("%s/v1beta2/models/chat-bison-001:generateMessage", baseURL)
 										}
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+										apiKey := c.Request.Header.Get("Authorization")
 										apiKey = strings.TrimPrefix(apiKey, "Bearer ")
 										fullRequestURL += "?key=" + apiKey
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+									case APITypeGemini:
 										requestBaseURL := "https://generativelanguage.googleapis.com"
 										if baseURL != "" {
 											requestBaseURL = baseURL
 										}
-												fix gemini

											
										
										
											2023-12-19 12:53:56 +08:00
+										version := "v1beta"
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+										if c.GetString("api_version") != "" {
 											version = c.GetString("api_version")
 										}
 										action := "generateContent"
 										if textRequest.Stream {
 											action = "streamGenerateContent"
 										}
 										fullRequestURL = fmt.Sprintf("%s/%s/models/%s:%s", requestBaseURL, version, textRequest.Model, action)
 										apiKey := c.Request.Header.Get("Authorization")
 										apiKey = strings.TrimPrefix(apiKey, "Bearer ")
 										fullRequestURL += "?key=" + apiKey
-												fix gemini

											
										
										
											2023-12-19 12:53:56 +08:00
+										//log.Println(fullRequestURL)
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+									case APITypeZhipu:
 										method := "invoke"
 										if textRequest.Stream {
 											method = "sse-invoke"
 										}
 										fullRequestURL = fmt.Sprintf("https://open.bigmodel.cn/api/paas/v3/model-api/%s/%s", textRequest.Model, method)
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+									case APITypeAli:
 										fullRequestURL = "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation"
-												fix: support ali's embedding model (#481, close #469)

* feat:支持阿里的 embedding 模型

* fix: add to model list

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-09-03 22:12:35 +08:00
+										if relayMode == RelayModeEmbeddings {
 											fullRequestURL = "https://dashscope.aliyuncs.com/api/v1/services/embeddings/text-embedding/text-embedding"
 										}
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+									case APITypeTencent:
 										fullRequestURL = "https://hunyuan.cloud.tencent.com/hyllm/v1/chat/completions"
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+									case APITypeAIProxyLibrary:
 										fullRequestURL = fmt.Sprintf("%s/api/library/ask", baseURL)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									}
 									var promptTokens int
-												feat: able to query logs now (close #144)

											
										
										
											2023-06-24 15:28:11 +08:00
+									var completionTokens int
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									switch relayMode {
 									case RelayModeChatCompletions:
-												support gpt-4-1106-vision-preview

											
										
										
											2023-11-17 18:24:37 +08:00
+										promptTokens, err = countTokenMessages(textRequest.Messages, textRequest.Model)
 										if err != nil {
 											return errorWrapper(err, "count_token_messages_failed", http.StatusInternalServerError)
 										}
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									case RelayModeCompletions:
 										promptTokens = countTokenInput(textRequest.Prompt, textRequest.Model)
-												feat: support /v1/edits now (close #196)

											
										
										
											2023-06-25 11:46:23 +08:00
+									case RelayModeModerations:
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										promptTokens = countTokenInput(textRequest.Input, textRequest.Model)
 									}
-												支持设置模型按次计费

											
										
										
											2023-12-21 20:14:04 +08:00
+									modelPrice := common.GetModelPrice(textRequest.Model)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									groupRatio := common.GetGroupRatio(group)
-												支持设置模型按次计费

											
										
										
											2023-12-21 20:14:04 +08:00
 									var preConsumedQuota int
 									var ratio float64
 									var modelRatio float64
 									if modelPrice == -1 {
 										preConsumedTokens := common.PreConsumedQuota
 										if textRequest.MaxTokens != 0 {
 											preConsumedTokens = promptTokens + int(textRequest.MaxTokens)
 										}
 										modelRatio = common.GetModelRatio(textRequest.Model)
 										ratio = modelRatio * groupRatio
 										preConsumedQuota = int(float64(preConsumedTokens) * ratio)
 									} else {
 										preConsumedQuota = int(modelPrice * common.QuotaPerUnit * groupRatio)
 									}
-												feat: do not access database before response return (close #158)

											
										
										
											2023-06-21 17:26:26 +08:00
+									userQuota, err := model.CacheGetUserQuota(userId)
 									if err != nil {
-												fix: fix http status code (close #193)

											
										
										
											2023-06-23 22:59:44 +08:00
+										return errorWrapper(err, "get_user_quota_failed", http.StatusInternalServerError)
-												feat: do not access database before response return (close #158)

											
										
										
											2023-06-21 17:26:26 +08:00
+									}
-												预扣费增加用户余额检测

											
										
										
											2023-12-05 17:11:37 +08:00
+									if userQuota < 0 || userQuota-preConsumedQuota < 0 {
-												fix: check user quota when pre-consume quota

											
										
										
											2023-10-01 12:49:40 +08:00
+										return errorWrapper(errors.New("user quota is not enough"), "insufficient_user_quota", http.StatusForbidden)
 									}
-												fix: update cache immediately after cache get

Co-authored-by: chikasaki <1347283135@qq.com>
Co-authored-by: Cruel <157922018@qq.com>

											
										
										
											2023-08-16 23:40:24 +08:00
+									err = model.CacheDecreaseUserQuota(userId, preConsumedQuota)
 									if err != nil {
 										return errorWrapper(err, "decrease_user_quota_failed", http.StatusInternalServerError)
 									}
 									if userQuota > 100*preConsumedQuota {
-												fix: 修复高并发下，高额度用户使用低额度令牌没有预扣费的问题

											
										
										
											2024-01-10 14:23:23 +08:00
+										// 用户额度充足，判断令牌额度是否充足
-												fix: 完善令牌预扣费逻辑

											
										
										
											2024-01-11 14:12:38 +08:00
+										if !tokenUnlimited {
-												fix: 修复高并发下，高额度用户使用低额度令牌没有预扣费的问题

											
										
										
											2024-01-10 14:23:23 +08:00
+											// 非无限令牌，判断令牌额度是否充足
-												fix: 完善令牌预扣费逻辑

											
										
										
											2024-01-11 14:12:38 +08:00
+											tokenQuota := c.GetInt("token_quota")
-												fix: 修复高并发下，高额度用户使用低额度令牌没有预扣费的问题

											
										
										
											2024-01-10 14:23:23 +08:00
+											if tokenQuota > 100*preConsumedQuota {
 												// 令牌额度充足，信任令牌
 												preConsumedQuota = 0
 												common.LogInfo(c.Request.Context(), fmt.Sprintf("user %d quota %d and token %d quota %d are enough, trusted and no need to pre-consume", userId, userQuota, tokenId, tokenQuota))
 											}
 										} else {
 											// in this case, we do not pre-consume quota
 											// because the user has enough quota
 											preConsumedQuota = 0
 											common.LogInfo(c.Request.Context(), fmt.Sprintf("user %d with unlimited token has enough quota %d, trusted and no need to pre-consume", userId, userQuota))
 										}
-												feat: do not access database before response return (close #158)

											
										
										
											2023-06-21 17:26:26 +08:00
+									}
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+									if preConsumedQuota > 0 {
-												修复余额不足邮件提醒bug

											
										
										
											2023-11-12 18:51:26 +08:00
+										userQuota, err = model.PreConsumeTokenQuota(tokenId, preConsumedQuota)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										if err != nil {
-												fix: fix http status code (close #193)

											
										
										
											2023-06-23 22:59:44 +08:00
+											return errorWrapper(err, "pre_consume_token_quota_failed", http.StatusForbidden)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										}
 									}
-												feat: support model remap now

											
										
										
											2023-06-27 13:42:45 +08:00
+									var requestBody io.Reader
 									if isModelMapped {
 										jsonStr, err := json.Marshal(textRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
 									} else {
 										requestBody = c.Request.Body
 									}
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									switch apiType {
 									case APITypeClaude:
-												refactor: refactor claude related code

											
										
										
											2023-07-22 17:12:13 +08:00
+										claudeRequest := requestOpenAI2Claude(textRequest)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+										jsonStr, err := json.Marshal(claudeRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+									case APITypeBaidu:
-												feat: support baidu's embedding model (close #324)

											
										
										
											2023-07-29 12:15:07 +08:00
+										var jsonData []byte
 										var err error
 										switch relayMode {
 										case RelayModeEmbeddings:
 											baiduEmbeddingRequest := embeddingRequestOpenAI2Baidu(textRequest)
 											jsonData, err = json.Marshal(baiduEmbeddingRequest)
 										default:
 											baiduRequest := requestOpenAI2Baidu(textRequest)
 											jsonData, err = json.Marshal(baiduRequest)
 										}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
-												feat: support baidu's embedding model (close #324)

											
										
										
											2023-07-29 12:15:07 +08:00
+										requestBody = bytes.NewBuffer(jsonData)
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+									case APITypePaLM:
 										palmRequest := requestOpenAI2PaLM(textRequest)
 										jsonStr, err := json.Marshal(palmRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+									case APITypeGemini:
 										geminiChatRequest := requestOpenAI2Gemini(textRequest)
 										jsonStr, err := json.Marshal(geminiChatRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+									case APITypeZhipu:
 										zhipuRequest := requestOpenAI2Zhipu(textRequest)
 										jsonStr, err := json.Marshal(zhipuRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+									case APITypeAli:
-												fix: support ali's embedding model (#481, close #469)

* feat:支持阿里的 embedding 模型

* fix: add to model list

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-09-03 22:12:35 +08:00
+										var jsonStr []byte
 										var err error
 										switch relayMode {
 										case RelayModeEmbeddings:
 											aliEmbeddingRequest := embeddingRequestOpenAI2Ali(textRequest)
 											jsonStr, err = json.Marshal(aliEmbeddingRequest)
 										default:
 											aliRequest := requestOpenAI2Ali(textRequest)
 											jsonStr, err = json.Marshal(aliRequest)
 										}
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+									case APITypeTencent:
 										apiKey := c.Request.Header.Get("Authorization")
 										apiKey = strings.TrimPrefix(apiKey, "Bearer ")
 										appId, secretId, secretKey, err := parseTencentConfig(apiKey)
 										if err != nil {
 											return errorWrapper(err, "invalid_tencent_config", http.StatusInternalServerError)
 										}
 										tencentRequest := requestOpenAI2Tencent(textRequest)
 										tencentRequest.AppId = appId
 										tencentRequest.SecretId = secretId
 										jsonStr, err := json.Marshal(tencentRequest)
 										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										sign := getTencentSign(*tencentRequest, secretKey)
 										c.Request.Header.Set("Authorization", sign)
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+									case APITypeAIProxyLibrary:
 										aiProxyLibraryRequest := requestOpenAI2AIProxyLibrary(textRequest)
 										aiProxyLibraryRequest.LibraryId = c.GetString("library_id")
 										jsonStr, err := json.Marshal(aiProxyLibraryRequest)
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+										if err != nil {
 											return errorWrapper(err, "marshal_text_request_failed", http.StatusInternalServerError)
 										}
 										requestBody = bytes.NewBuffer(jsonStr)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
 									var req *http.Request
 									var resp *http.Response
 									isStream := textRequest.Stream
 									if apiType != APITypeXunfei { // cause xunfei use websocket
 										req, err = http.NewRequest(c.Request.Method, fullRequestURL, requestBody)
-												修复多路复用bug

											
										
										
											2023-08-31 00:44:16 +08:00
+										// 设置GetBody函数，该函数返回一个新的io.ReadCloser，该io.ReadCloser返回与原始请求体相同的数据
 										req.GetBody = func() (io.ReadCloser, error) {
 											return io.NopCloser(requestBody), nil
 										}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										if err != nil {
 											return errorWrapper(err, "new_request_failed", http.StatusInternalServerError)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+										}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										apiKey := c.Request.Header.Get("Authorization")
 										apiKey = strings.TrimPrefix(apiKey, "Bearer ")
 										switch apiType {
 										case APITypeOpenAI:
 											if channelType == common.ChannelTypeAzure {
 												req.Header.Set("api-key", apiKey)
 											} else {
 												req.Header.Set("Authorization", c.Request.Header.Get("Authorization"))
-												feat: 渠道支持指定组织

											
										
										
											2023-09-15 17:59:01 +08:00
+												if c.Request.Header.Get("OpenAI-Organization") != "" {
 													req.Header.Set("OpenAI-Organization", c.Request.Header.Get("OpenAI-Organization"))
 												}
-												feat: supper OpenRouter now (close #333, close #340)

											
										
										
											2023-08-27 16:16:45 +08:00
+												if channelType == common.ChannelTypeOpenRouter {
 													req.Header.Set("HTTP-Referer", "https://github.com/songquanpeng/one-api")
 													req.Header.Set("X-Title", "One API")
 												}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+											}
 										case APITypeClaude:
 											req.Header.Set("x-api-key", apiKey)
 											anthropicVersion := c.Request.Header.Get("anthropic-version")
 											if anthropicVersion == "" {
 												anthropicVersion = "2023-06-01"
 											}
 											req.Header.Set("anthropic-version", anthropicVersion)
 										case APITypeZhipu:
 											token := getZhipuToken(apiKey)
 											req.Header.Set("Authorization", token)
 										case APITypeAli:
 											req.Header.Set("Authorization", "Bearer "+apiKey)
 											if textRequest.Stream {
 												req.Header.Set("X-DashScope-SSE", "enable")
 											}
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+										case APITypeTencent:
 											req.Header.Set("Authorization", apiKey)
-												fix gemini

											
										
										
											2023-12-21 23:08:09 +08:00
+										case APITypeGemini:
 											req.Header.Set("Content-Type", "application/json")
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+										default:
 											req.Header.Set("Authorization", "Bearer "+apiKey)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+										}
-												fix gemini

											
										
										
											2023-12-21 23:08:09 +08:00
+										if apiType != APITypeGemini {
 											// 设置公共头部...
 											req.Header.Set("Content-Type", c.Request.Header.Get("Content-Type"))
 											req.Header.Set("Accept", c.Request.Header.Get("Accept"))
 											if isStream && c.Request.Header.Get("Accept") == "" {
 												req.Header.Set("Accept", "text/event-stream")
 											}
-												fix: set Accept header if not given (#615)

* fix: fastgpt调用通义千问问答失败

* refactor: Dockerfile

* Revert "refactor: Dockerfile"

This reverts commit a538c4f28eaf4dee66df3b4d951a3dc29d4db9ec.

* chore: update implementation

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
											
										
										
											2023-10-22 17:56:20 +08:00
+										}
-												更换前端组件库

											
										
										
											2023-10-31 00:03:22 +08:00
+										//req.HeaderBar.Set("Connection", c.Request.HeaderBar.Get("Connection"))
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										resp, err = httpClient.Do(req)
 										if err != nil {
 											return errorWrapper(err, "do_request_failed", http.StatusInternalServerError)
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+										}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										err = req.Body.Close()
 										if err != nil {
 											return errorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
 										}
 										err = c.Request.Body.Close()
 										if err != nil {
 											return errorWrapper(err, "close_request_body_failed", http.StatusInternalServerError)
 										}
-												fix: fix stream mode determine related logic (close #360)

											
										
										
											2023-08-06 18:09:00 +08:00
+										isStream = isStream || strings.HasPrefix(resp.Header.Get("Content-Type"), "text/event-stream")
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
-												fix: fix xunfei crash (#451)


											
										
										
											2023-08-20 22:07:50 +08:00
+										if resp.StatusCode != http.StatusOK {
-												perf: only return quota when it's not zero

											
										
										
											2023-09-13 22:05:10 +08:00
+											if preConsumedQuota != 0 {
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+												go func(ctx context.Context) {
-												perf: only return quota when it's not zero

											
										
										
											2023-09-13 22:05:10 +08:00
+													// return pre-consumed quota
-												try to fix email

											
										
										
											2023-11-15 18:27:13 +08:00
+													err := model.PostConsumeTokenQuota(tokenId, userQuota, -preConsumedQuota, 0, false)
-												perf: only return quota when it's not zero

											
										
										
											2023-09-13 22:05:10 +08:00
+													if err != nil {
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+														common.LogError(ctx, "error return pre-consumed quota: "+err.Error())
-												perf: only return quota when it's not zero

											
										
										
											2023-09-13 22:05:10 +08:00
+													}
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+												}(c.Request.Context())
-												perf: only return quota when it's not zero

											
										
										
											2023-09-13 22:05:10 +08:00
+											}
-												merge

											
										
										
											2023-09-09 01:50:41 +08:00
+											return relayErrorHandler(resp)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+										}
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									}
-												fix: empty completion issue caused by bad status code from upstream channel (#422)


											
										
										
											2023-08-19 17:58:45 +08:00
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									var textResponse TextResponse
-												perf: use a goroutine to handle quota post consumption (#364)

											
										
										
											2023-08-12 19:36:31 +08:00
+									tokenName := c.GetString("token_name")
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+									defer func(ctx context.Context) {
-												perf: use a goroutine to handle quota post consumption (#364)

											
										
										
											2023-08-12 19:36:31 +08:00
+										// c.Writer.Flush()
 										go func() {
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+											promptTokens = textResponse.Usage.PromptTokens
 											completionTokens = textResponse.Usage.CompletionTokens
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
-												支持设置模型按次计费

											
										
										
											2023-12-21 20:14:04 +08:00
+											quota := 0
 											if modelPrice == -1 {
 												completionRatio := common.GetCompletionRatio(textRequest.Model)
 												quota = promptTokens + int(float64(completionTokens)*completionRatio)
 												quota = int(float64(quota) * ratio)
 												if ratio != 0 && quota <= 0 {
 													quota = 1
 												}
 											} else {
 												quota = int(modelPrice * common.QuotaPerUnit * groupRatio)
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+											}
 											totalTokens := promptTokens + completionTokens
 											if totalTokens == 0 {
 												// in this case, must be some error happened
 												// we cannot just return, because we may have to return the pre-consumed quota
 												quota = 0
 											}
 											quotaDelta := quota - preConsumedQuota
 											err := model.PostConsumeTokenQuota(tokenId, userQuota, quotaDelta, preConsumedQuota, true)
 											if err != nil {
 												common.LogError(ctx, "error consuming token remain quota: "+err.Error())
 											}
 											err = model.CacheUpdateUserQuota(userId)
 											if err != nil {
 												common.LogError(ctx, "error update user quota cache: "+err.Error())
-												fix: do not record if used quota is zero

											
										
										
											2023-06-25 09:59:58 +08:00
+											}
-												优化gpt-4-gizmo-*日志

											
										
										
											2023-12-21 20:20:09 +08:00
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+											// record all the consume log even if quota is 0
-												record relay time

											
										
										
											2023-11-23 03:06:04 +08:00
+											useTimeSeconds := time.Now().Unix() - startTime.Unix()
-												支持设置模型按次计费

											
										
										
											2023-12-21 20:14:04 +08:00
+											var logContent string
 											if modelPrice == -1 {
 												logContent = fmt.Sprintf("模型倍率 %.2f，分组倍率 %.2f，用时 %d秒", modelRatio, groupRatio, useTimeSeconds)
 											} else {
 												logContent = fmt.Sprintf("模型价格 %.2f，分组倍率 %.2f，用时 %d秒", modelPrice, groupRatio, useTimeSeconds)
 											}
-												优化gpt-4-gizmo-*日志

											
										
										
											2023-12-21 20:20:09 +08:00
+											logModel := textRequest.Model
 											if strings.HasPrefix(logModel, "gpt-4-gizmo") {
 												logModel = "gpt-4-gizmo-*"
 												logContent += fmt.Sprintf("，模型 %s", textRequest.Model)
 											}
 											model.RecordConsumeLog(ctx, userId, channelId, promptTokens, completionTokens, logModel, tokenName, quota, logContent, tokenId, userQuota)
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+											model.UpdateUserUsedQuotaAndRequestCount(userId, quota)
 											model.UpdateChannelUsedQuota(channelId, quota)
 											//if quota != 0 {
 											//
 											//}
-												perf: use a goroutine to handle quota post consumption (#364)

											
										
										
											2023-08-12 19:36:31 +08:00
+										}()
-												refactor: update logging related logic

											
										
										
											2023-09-17 15:39:46 +08:00
+									}(c.Request.Context())
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									switch apiType {
 									case APITypeOpenAI:
 										if isStream {
-												refactor: refactor openai related code

											
										
										
											2023-07-22 17:48:45 +08:00
+											err, responseText := openaiStreamHandler(c, resp, relayMode)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											if err != nil {
-												refactor: refactor openai related code

											
										
										
											2023-07-22 17:48:45 +08:00
+												return err
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+											}
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
+											textResponse.Usage.PromptTokens = promptTokens
 											textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											return nil
 										} else {
-												删除relay-text中的consumeQuota变量

											
										
										
											2023-11-23 02:56:18 +08:00
+											err, usage := openaiHandler(c, resp, promptTokens, textRequest.Model)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											if err != nil {
-												refactor: refactor openai related code

											
										
										
											2023-07-22 17:48:45 +08:00
+												return err
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											return nil
 										}
 									case APITypeClaude:
 										if isStream {
-												refactor: refactor claude related code

											
										
										
											2023-07-22 17:36:40 +08:00
+											err, responseText := claudeStreamHandler(c, resp)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											if err != nil {
-												refactor: refactor claude related code

											
										
										
											2023-07-22 17:36:40 +08:00
+												return err
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+											}
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
+											textResponse.Usage.PromptTokens = promptTokens
 											textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											return nil
 										} else {
-												refactor: refactor claude related code

											
										
										
											2023-07-22 17:36:40 +08:00
+											err, usage := claudeHandler(c, resp, promptTokens, textRequest.Model)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+											if err != nil {
-												refactor: refactor claude related code

											
										
										
											2023-07-22 17:36:40 +08:00
+												return err
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+											}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+											return nil
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+										}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+									case APITypeBaidu:
 										if isStream {
 											err, usage := baiduStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+											return nil
 										} else {
-												feat: support baidu's embedding model (close #324)

											
										
										
											2023-07-29 12:15:07 +08:00
+											var err *OpenAIErrorWithStatusCode
 											var usage *Usage
 											switch relayMode {
 											case RelayModeEmbeddings:
 												err, usage = baiduEmbeddingHandler(c, resp)
 											default:
 												err, usage = baiduHandler(c, resp)
 											}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+											if err != nil {
 												return err
 											}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												feat: support baidu's models now (close #286)

											
										
										
											2023-07-22 23:24:09 +08:00
+											return nil
 										}
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+									case APITypePaLM:
 										if textRequest.Stream { // PaLM2 API does not support stream
 											err, responseText := palmStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
+											textResponse.Usage.PromptTokens = promptTokens
 											textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+											return nil
 										} else {
 											err, usage := palmHandler(c, resp, promptTokens, textRequest.Model)
 											if err != nil {
 												return err
 											}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										}
-												添加gemini支持

											
										
										
											2023-12-18 23:45:08 +08:00
+									case APITypeGemini:
 										if textRequest.Stream {
 											err, responseText := geminiChatStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											textResponse.Usage.PromptTokens = promptTokens
 											textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
 											return nil
 										} else {
 											err, usage := geminiChatHandler(c, resp, promptTokens, textRequest.Model)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										}
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+									case APITypeZhipu:
 										if isStream {
 											err, usage := zhipuStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
+											// zhipu's API does not return prompt tokens & completion tokens
 											textResponse.Usage.PromptTokens = textResponse.Usage.TotalTokens
-												feat: support zhipu's ChatGLM (close #289)

											
										
										
											2023-07-23 11:51:44 +08:00
+											return nil
 										} else {
 											err, usage := zhipuHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
-												refactor: update billing related code

											
										
										
											2023-07-29 22:32:05 +08:00
+											// zhipu's API does not return prompt tokens & completion tokens
 											textResponse.Usage.PromptTokens = textResponse.Usage.TotalTokens
-												feat: support Google PaLM2 (close #105)

											
										
										
											2023-07-23 00:32:47 +08:00
+											return nil
 										}
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+									case APITypeAli:
 										if isStream {
 											err, usage := aliStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										} else {
-												fix: support ali's embedding model (#481, close #469)

* feat:支持阿里的 embedding 模型

* fix: add to model list

---------

Co-authored-by: JustSong <songquanpeng@foxmail.com>
Co-authored-by: JustSong <39998050+songquanpeng@users.noreply.github.com>
											
										
										
											2023-09-03 22:12:35 +08:00
+											var err *OpenAIErrorWithStatusCode
 											var usage *Usage
 											switch relayMode {
 											case RelayModeEmbeddings:
 												err, usage = aliEmbeddingHandler(c, resp)
 											default:
 												err, usage = aliHandler(c, resp)
 											}
-												feat: support ali's llm (close #326)

											
										
										
											2023-07-28 23:45:08 +08:00
+											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										}
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+									case APITypeXunfei:
-												feat: support non-stream mode for xunfei (#498)

* feat:xunfei suport none stream

* fix:join content ignore seq

---------

Co-authored-by: igophper <admin@jialilgu.cn>
											
										
										
											2023-09-17 18:16:12 +08:00
+										auth := c.Request.Header.Get("Authorization")
 										auth = strings.TrimPrefix(auth, "Bearer ")
 										splits := strings.Split(auth, "|")
 										if len(splits) != 3 {
 											return errorWrapper(errors.New("invalid auth"), "invalid_auth", http.StatusBadRequest)
 										}
 										var err *OpenAIErrorWithStatusCode
 										var usage *Usage
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										if isStream {
-												feat: support non-stream mode for xunfei (#498)

* feat:xunfei suport none stream

* fix:join content ignore seq

---------

Co-authored-by: igophper <admin@jialilgu.cn>
											
										
										
											2023-09-17 18:16:12 +08:00
+											err, usage = xunfeiStreamHandler(c, textRequest, splits[0], splits[1], splits[2])
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										} else {
-												feat: support non-stream mode for xunfei (#498)

* feat:xunfei suport none stream

* fix:join content ignore seq

---------

Co-authored-by: igophper <admin@jialilgu.cn>
											
										
										
											2023-09-17 18:16:12 +08:00
+											err, usage = xunfeiHandler(c, textRequest, splits[0], splits[1], splits[2])
 										}
 										if err != nil {
 											return err
 										}
 										if usage != nil {
 											textResponse.Usage = *usage
-												feat: support xunfei's llm (close #206)

											
										
										
											2023-07-29 21:55:57 +08:00
+										}
-												feat: support non-stream mode for xunfei (#498)

* feat:xunfei suport none stream

* fix:join content ignore seq

---------

Co-authored-by: igophper <admin@jialilgu.cn>
											
										
										
											2023-09-17 18:16:12 +08:00
+										return nil
-												feat: support aiproxy's library

											
										
										
											2023-09-03 12:51:59 +08:00
+									case APITypeAIProxyLibrary:
 										if isStream {
 											err, usage := aiProxyLibraryStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										} else {
 											err, usage := aiProxyLibraryHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										}
-												feat: support Tencent's model (close #519)

											
										
										
											2023-10-03 14:19:03 +08:00
+									case APITypeTencent:
 										if isStream {
 											err, responseText := tencentStreamHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											textResponse.Usage.PromptTokens = promptTokens
 											textResponse.Usage.CompletionTokens = countTokenText(responseText, textRequest.Model)
 											return nil
 										} else {
 											err, usage := tencentHandler(c, resp)
 											if err != nil {
 												return err
 											}
 											if usage != nil {
 												textResponse.Usage = *usage
 											}
 											return nil
 										}
-												feat: support claude now (close #150)

											
										
										
											2023-07-22 16:18:03 +08:00
+									default:
 										return errorWrapper(errors.New("unknown api type"), "unknown_api_type", http.StatusInternalServerError)
-												refactor: split the relay controller

											
										
										
											2023-06-19 10:28:55 +08:00
+									}
 								}