merge

2026-02-23 15:49:50 +01:00 · 2023-08-04 16:57:05 +02:00
parent bcc9cee3c1 b82a7b79d4
commit e2e67b3f41
2 changed files with 43 additions and 10 deletions
--- a/euclid/const/llm.py
+++ b/euclid/const/llm.py
@@ -1,4 +1,4 @@
 MIN_TOKENS_FOR_GPT_RESPONSE = 60
-MAX_GPT_MODEL_TOKENS = 4096
+MAX_GPT_MODEL_TOKENS = 8192
 MAX_QUESTIONS = 3
 END_RESPONSE = "EVERYTHING_CLEAR"
--- a/euclid/utils/llm_connection.py
+++ b/euclid/utils/llm_connection.py
@@ -1,8 +1,7 @@
 # llm_connection_old.py
 import requests
 import os
 import json
-# from tiktoken import Tokenizer
+import tiktoken
 from typing import List
 from jinja2 import Environment, FileSystemLoader
@@ -40,16 +39,50 @@ def get_prompt(prompt_name, data=None):
 def get_tokens_in_messages(messages: List[str]) -> int:
-    tokenizer = Tokenizer()
+    tokenizer = tiktoken.get_encoding("cl100k_base") # GPT-4 tokenizer
-    tokenized_messages = [tokenizer.encode(message) for message in messages]
+    tokenized_messages = [tokenizer.encode(message['content']) for message in messages]
    return sum(len(tokens) for tokens in tokenized_messages)
 def num_tokens_from_functions(functions, model="gpt-4"):
        """Return the number of tokens used by a list of functions."""
        encoding = tiktoken.get_encoding("cl100k_base")
-def create_gpt_chat_completion(messages: List[dict], req_type, min_tokens=MIN_TOKENS_FOR_GPT_RESPONSE,
+        num_tokens = 0
-                               function_calls=None):
+        for function in functions:
-    api_key = os.getenv("OPENAI_API_KEY")
+            function_tokens = len(encoding.encode(function['name']))
-    #     tokens_in_messages = get_tokens_in_messages(messages)
+            function_tokens += len(encoding.encode(function['description']))
-    tokens_in_messages = 100
+
            if 'parameters' in function:
                parameters = function['parameters']
                if 'properties' in parameters:
                    for propertiesKey in parameters['properties']:
                        function_tokens += len(encoding.encode(propertiesKey))
                        v = parameters['properties'][propertiesKey]
                        for field in v:
                            if field == 'type':
                                function_tokens += 2
                                function_tokens += len(encoding.encode(v['type']))
                            elif field == 'description':
                                function_tokens += 2
                                function_tokens += len(encoding.encode(v['description']))
                            elif field == 'enum':
                                function_tokens -= 3
                                for o in v['enum']:
                                    function_tokens += 3
                                    function_tokens += len(encoding.encode(o))
                            else:
                                print(f"Warning: not supported field {field}")
                    function_tokens += 11
            num_tokens += function_tokens
        num_tokens += 12
        return num_tokens
 def create_gpt_chat_completion(messages: List[dict], req_type, min_tokens=MIN_TOKENS_FOR_GPT_RESPONSE, function_calls=None):
    tokens_in_messages = round(get_tokens_in_messages(messages) * 1.2) # add 20% to account for not 100% accuracy
    if function_calls is not None:
        tokens_in_messages += round(num_tokens_from_functions(function_calls['definitions']) * 1.2) # add 20% to account for not 100% accuracy
    if tokens_in_messages + min_tokens > MAX_GPT_MODEL_TOKENS:
        raise ValueError(f'Too many tokens in messages: {tokens_in_messages}. Please try a different test.')