penta
/
chatbot-maisonnette
spiegel van https://github.com/Penta/chatbot-maisonnette


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430
							import os
import base64
import logging
import re
from io import BytesIO
import discord
from dotenv import load_dotenv
from PIL import Image
import emoji
import tiktoken
from openai import AsyncOpenAI, OpenAIError

# Charger les variables d'environnement depuis le fichier .env
load_dotenv()
DISCORD_TOKEN = os.getenv('DISCORD_TOKEN')
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
DISCORD_CHANNEL_ID = os.getenv('DISCORD_CHANNEL_ID')

# Chemin vers le fichier de prompt de personnalité
PERSONALITY_PROMPT_FILE = os.getenv('PERSONALITY_PROMPT_FILE', 'personality_prompt.txt')

# Vérifier que les tokens et le prompt de personnalité sont récupérés
if DISCORD_TOKEN is None or OPENAI_API_KEY is None or DISCORD_CHANNEL_ID is None:
    raise ValueError("Les tokens ou l'ID du canal ne sont pas définis dans les variables d'environnement.")

if not os.path.isfile(PERSONALITY_PROMPT_FILE):
    raise FileNotFoundError(f"Le fichier de prompt de personnalité '{PERSONALITY_PROMPT_FILE}' est introuvable.")

# Lire le prompt de personnalité depuis le fichier
with open(PERSONALITY_PROMPT_FILE, 'r', encoding='utf-8') as f:
    PERSONALITY_PROMPT = f.read().strip()

# Log configuration
log_format = '%(asctime)-13s : %(name)-15s : %(levelname)-8s : %(message)s'
logging.basicConfig(handlers=[logging.FileHandler("./chatbot.log", 'a', 'utf-8')], format=log_format, level="INFO")

console = logging.StreamHandler()
console.setLevel(logging.INFO)
console.setFormatter(logging.Formatter(log_format))

logger = logging.getLogger("chatbot")
logger.setLevel("INFO")

logging.getLogger('').addHandler(console)

httpx_logger = logging.getLogger('httpx')
httpx_logger.setLevel(logging.WARNING)

# Initialiser les intents
intents = discord.Intents.default()
intents.message_content = True  # Activer l'intent pour les contenus de message

# Liste pour stocker l'historique des conversations
conversation_history = []

# Convertir l'ID du channel en entier
try:
    chatgpt_channel_id = int(DISCORD_CHANNEL_ID)
except ValueError:
    raise ValueError("L'ID du channel Discord est invalide. Assurez-vous qu'il s'agit d'un entier.")

"""Module contenant un bot Discord utilisant l'API OpenAI."""
class MyDiscordClient(discord.Client):
    """Classe personnalisée pour le client Discord."""
    async def close(self):
        """Ferme le client Discord et OpenAI proprement."""
        global openai_client
        if openai_client is not None:
            await openai_client.close()
            openai_client = None
        await super().close()

# Initialiser le client Discord avec les intents modifiés
client_discord = MyDiscordClient(intents=intents)

# Initialiser le client OpenAI asynchrone
openai_client = AsyncOpenAI(api_key=OPENAI_API_KEY)

# Charger l'encodeur pour le modèle GPT-4o
encoding = tiktoken.get_encoding("o200k_base")

def resize_image(image_bytes, mode='high'):
    with Image.open(BytesIO(image_bytes)) as img:
        if mode == 'high':
            # Redimensionner pour le mode haute fidélité
            img.thumbnail((2000, 2000))
            if min(img.size) < 768:
                scale = 768 / min(img.size)
                new_size = tuple(int(x * scale) for x in img.size)
                img = img.resize(new_size, Image.Resampling.LANCZOS)
        elif mode == 'low':
            # Redimensionner pour le mode basse fidélité
            img = img.resize((512, 512))
        buffer = BytesIO()
        img.save(buffer, format=img.format)
        return buffer.getvalue()

def contains_ascii_art(text):
    """
    Détecte la présence d'au moins un bloc d'ASCII art dans le texte.
    Un bloc d'ASCII art est défini par un minimum de lignes avec une densité élevée de caractères spéciaux.
    """
    lines = text.split('\n')
    current_block = []
    detected = False

    density_threshold = 0.2  # Proportion minimale de caractères spéciaux
    min_lines = 3  # Nombre minimum de lignes pour un bloc d'ASCII art

    for line in lines:
        if line.strip() == '':
            # Fin d'un bloc potentiel
            if len(current_block) >= min_lines and block_is_ascii_art(current_block, density_threshold):
                detected = True
                break
            current_block = []
        else:
            current_block.append(line)

    # Vérifier le dernier bloc
    if not detected and len(current_block) >= min_lines and block_is_ascii_art(current_block, density_threshold):
        detected = True

    return detected

def block_is_ascii_art(block, density_threshold):
    """
    Évalue si un bloc de lignes correspond aux critères d'un dessin ASCII.
    """

    special_char_count = sum(len(re.findall(r'[^\w\s]', line)) for line in block)
    total_chars = sum(len(line) for line in block)

    if total_chars == 0:
        return False

    density = special_char_count / total_chars

    if density < density_threshold:
        return False

    average_length = sum(len(line) for line in block) / len(block)
    similar_length_lines = sum(1 for line in block if abs(len(line) - average_length) < 5)

    if similar_length_lines >= len(block) * 0.8:
        return True

    return False

def is_long_special_text(text):
    # Vérifier que le texte est bien une chaîne de caractères
    if not isinstance(text, str):
        logger.error(f"Erreur : Le contenu n'est pas une chaîne valide. Contenu : {text}")
        return False

    # Compter le nombre de tokens dans le texte
    token_count = len(encoding.encode(text))

    # Définir un seuil pour considérer le texte comme long
    if token_count > 200:
        logger.info("Texte long détecté : %d tokens", token_count)
        return True
    return False

def extract_text_from_message(message):
    content = message.get("content", "")
    if isinstance(content, list):
        # Extraire le texte de chaque élément de la liste
        texts = []
        for part in content:
            if isinstance(part, dict):
                text = part.get("text", "")
                if text:
                    texts.append(text)
        return ' '.join(texts)
    elif isinstance(content, str):
        return content
    else:
        return ""

def calculate_cost(usage):
    input_tokens = usage.get('prompt_tokens', 0)
    output_tokens = usage.get('completion_tokens', 0)

    # Coûts estimés
    input_cost = input_tokens / 1_000_000 * 5.00  # 5$ pour 1M tokens d'entrée
    output_cost = output_tokens / 1_000_000 * 15.00  # 15$ pour 1M tokens de sortie
    total_cost = input_cost + output_cost

    return input_tokens, output_tokens, total_cost

def is_relevant_message(message):
    content = message["content"]

    if isinstance(content, list):
        content = ''.join(part.get('text', '') for part in content if 'text' in part)

    if len(content.strip()) < 5:
        return False

    discord_emoji_pattern = r'<a?:\w+:\d+>'

    def is_discord_emoji(part):
        return bool(re.fullmatch(discord_emoji_pattern, part))

    tokens = re.split(discord_emoji_pattern, content)
    emojis_only = True
    standard_emojis = [char for char in content if emoji.is_emoji(char)]
    discord_emojis = re.findall(discord_emoji_pattern, content)

    text_without_emojis = re.sub(discord_emoji_pattern, '', content)
    for char in text_without_emojis:
        if not char.isspace() and not emoji.is_emoji(char):
            emojis_only = False
            break

    if len(standard_emojis) + len(discord_emojis) == 0:
        emojis_only = False

    if emojis_only and len(content.strip()) > 0:
        return False

    return True

async def read_text_file(attachment):
    file_bytes = await attachment.read()
    return file_bytes.decode('utf-8')

async def encode_image_from_attachment(attachment, mode='high'):
    image_data = await attachment.read()
    resized_image = resize_image(image_data, mode=mode)
    return base64.b64encode(resized_image).decode('utf-8')

async def summarize_text(text, max_tokens=50):
    summary_prompt = f"Résumé :\n\n{text}\n\nRésumé:"
    try:
        response = await openai_client.chat.completions.create(
            model="gpt-4o",
            messages=[
                {"role": "system", "content": "You are a helpful assistant."},
                {"role": "user", "content": summary_prompt}
            ],
            max_tokens=max_tokens  # Limitez les tokens pour obtenir un résumé court
        )
        summary = response.choices[0].message.content.strip()
        if hasattr(response, 'usage'):
            usage_dict = {
                'prompt_tokens': response.usage.prompt_tokens,
                'completion_tokens': response.usage.completion_tokens
            }
        else:
            usage_dict = {}
        return summary, usage_dict
    except OpenAIError as e:
        logger.error(f"Error summarizing text: {e}")
        return text, {}
    except AttributeError as e:
        logger.error(f"Attribute error during summarization: {e}")
        return text, {}

async def call_openai_api(user_text, user_name, image_data=None, detail='high'):

    # Préparer le contenu pour l'appel API
    message_to_send = {
        "role": "user",
        "content": [
            {"type": "text", "text": f"{user_name} dit : {user_text}"}
        ]
    }

    # Inclure l'image dans l'appel API courant
    if image_data:
        message_to_send["content"].append({
            "type": "image_url",
            "image_url": {
                "url": f"data:image/jpeg;base64,{image_data}",
                "detail": detail
            }
        })

    try:
        response = await openai_client.chat.completions.create(
            model="gpt-4o",
            messages=conversation_history + [message_to_send],
            max_tokens=400
        )

        if response:
            reply = response.choices[0].message.content

        # Ajouter le message de l'utilisateur à l'historique global, mais uniquement s'il ne s'agit pas d'une image ou d'ASCII art
        if image_data is None and not contains_ascii_art(user_text):
            await add_to_conversation_history(message_to_send)

        # Ajouter la réponse de l'IA directement à l'historique
        await add_to_conversation_history({
            "role": "assistant",
            "content": reply
        })

        if hasattr(response, 'usage') and response.usage:
            usage = response.usage
            input_tokens, output_tokens, total_cost = calculate_cost({
                'prompt_tokens': usage.prompt_tokens,
                'completion_tokens': usage.completion_tokens
            })

        # Afficher dans la console
        logging.info(f"Coût de la réponse : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")

        return response
    except OpenAIError as e:
        logger.error(f"Error calling OpenAI API: {e}")
    except Exception as e:
        logger.error(f"Error calling OpenAI API: {e}")
    return None

@client_discord.event
async def on_ready():
    logger.info(f'Bot connecté en tant que {client_discord.user}')

    # Ajouter la personnalité de l'IA à l'historique au démarrage
    if not conversation_history:
        conversation_history.append({
            "role": "system",
            "content": PERSONALITY_PROMPT
        })

@client_discord.event
async def on_disconnect():
    await client_discord.close()

@client_discord.event
async def on_message(message):
    # Vérifier si le message provient du canal autorisé
    if message.channel.id != chatgpt_channel_id:
        return

    # Vérifier si l'auteur du message est le bot lui-même
    if message.author == client_discord.user:
        return

    user_text = message.content.strip()
    image_data = None
    file_content = None

    # Vérifier si le message contient un dessin ASCII
    if contains_ascii_art(user_text):
        logger.info(f"Dessin ASCII détecté de {message.author.name}")

    # Extensions de fichiers autorisées
    allowed_extensions = ['.txt', '.py', '.html', '.css', '.js']

    # Vérifier s'il y a une pièce jointe
    if message.attachments:
        for attachment in message.attachments:
            # Vérifier si c'est un fichier avec une extension autorisée
            if any(attachment.filename.endswith(ext) for ext in allowed_extensions):
                file_content = await read_text_file(attachment)
                break
            # Vérifier si c'est une image
            elif attachment.content_type.startswith('image'):
                image_data = await encode_image_from_attachment(attachment, mode='high')
                break

    # Ajouter le contenu du fichier à la requête si présent
    if file_content:
        user_text += f"\nContenu du fichier {attachment.filename}:\n{file_content}"

    # Appeler l'API OpenAI
    result = await call_openai_api(user_text, message.author.name, image_data)
    if result:
        reply = result.choices[0].message.content
        await message.channel.send(reply)

async def add_to_conversation_history(new_message):

    # Extraire le texte du message
    if isinstance(new_message["content"], list) and len(new_message["content"]) > 0:
        content_text = new_message["content"][0].get("text", "")
    else:
        content_text = new_message.get("content", "")

    if not isinstance(content_text, str):
        logger.error(f"Erreur : Le contenu n'est pas une chaîne valide. Contenu : {content_text}")
        return

    if is_long_special_text(content_text):
        summary, usage = await summarize_text(content_text)
        new_message = {
            "role": new_message["role"],
            "content": summary
        }

        # Inclure le coût du résumé dans le calcul total
        input_tokens, output_tokens, total_cost = calculate_cost(usage)
        logging.info(f"Coût du résumé : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")

    # Filtrer les messages pertinents pour l'historique
    if is_relevant_message(new_message):
        # Ajouter le message à l'historique
        conversation_history.append(new_message)
    # Synthétiser les messages les plus anciens si l'historique est trop long
    if len(conversation_history) > 30:
        # Synthétiser les 20 plus anciens messages (exclure la personnalité et les 10 plus récents)
        messages_to_summarize = conversation_history[1:21]  # Exclure le premier (personnalité)
        texts = [extract_text_from_message(msg) for msg in messages_to_summarize]
        texts = [text for text in texts if text]

        combined_text = ' '.join(texts)

        combined_token_count = len(encoding.encode(combined_text))
        if combined_token_count > 15000:
            encoded_text = encoding.encode(combined_text)
            truncated_text = encoding.decode(encoded_text[:500])
            combined_text = truncated_text
            logger.info(f"Combined text tronqué à 15 000 tokens.")

        synthesized_summary, usage = await summarize_text(combined_text, max_tokens=400)

        # Calculer le coût de la synthèse
        input_tokens, output_tokens, total_cost = calculate_cost(usage)
        logging.info(f"30 messages dans l'historique. Synthèse effectuée. Coût : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")

        # Remplacer l'ancienne synthèse par la nouvelle
        # Conserver la personnalité et la nouvelle synthèse
        conversation_history[:] = [conversation_history[0], {"role": "system", "content": synthesized_summary}] + conversation_history[21:]

# Démarrer le bot Discord
client_discord.run(DISCORD_TOKEN)