chatbot.py 18 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461
  1. import os
  2. import base64
  3. import logging
  4. import re
  5. from io import BytesIO
  6. import discord
  7. from dotenv import load_dotenv
  8. from PIL import Image
  9. import emoji
  10. import tiktoken
  11. from openai import AsyncOpenAI, OpenAIError
  12. import json
  13. # Charger les variables d'environnement depuis le fichier .env
  14. load_dotenv()
  15. DISCORD_TOKEN = os.getenv('DISCORD_TOKEN')
  16. OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
  17. DISCORD_CHANNEL_ID = os.getenv('DISCORD_CHANNEL_ID')
  18. PERSONALITY_PROMPT_FILE = os.getenv('PERSONALITY_PROMPT_FILE', 'personality_prompt.txt')
  19. CONVERSATION_HISTORY_FILE = os.getenv('CONVERSATION_HISTORY_FILE', 'conversation_history.json')
  20. # Initialiser le client OpenAI asynchrone ici
  21. openai_client = AsyncOpenAI(api_key=OPENAI_API_KEY)
  22. BOT_VERSION = "2.1.0"
  23. # Vérifier que les tokens et le prompt de personnalité sont récupérés
  24. if DISCORD_TOKEN is None or OPENAI_API_KEY is None or DISCORD_CHANNEL_ID is None:
  25. raise ValueError("Les tokens ou l'ID du canal ne sont pas définis dans les variables d'environnement.")
  26. if not os.path.isfile(PERSONALITY_PROMPT_FILE):
  27. raise FileNotFoundError(f"Le fichier de prompt de personnalité '{PERSONALITY_PROMPT_FILE}' est introuvable.")
  28. # Lire le prompt de personnalité depuis le fichier
  29. with open(PERSONALITY_PROMPT_FILE, 'r', encoding='utf-8') as f:
  30. PERSONALITY_PROMPT = f.read().strip()
  31. # Log configuration
  32. log_format = '%(asctime)-13s : %(name)-15s : %(levelname)-8s : %(message)s'
  33. logging.basicConfig(handlers=[logging.FileHandler("./chatbot.log", 'a', 'utf-8')], format=log_format, level="INFO")
  34. console = logging.StreamHandler()
  35. console.setLevel(logging.INFO)
  36. console.setFormatter(logging.Formatter(log_format))
  37. logger = logging.getLogger("chatbot")
  38. logger.setLevel("INFO")
  39. logging.getLogger('').addHandler(console)
  40. httpx_logger = logging.getLogger('httpx')
  41. httpx_logger.setLevel(logging.WARNING)
  42. # Initialiser les intents
  43. intents = discord.Intents.default()
  44. intents.message_content = True # Activer l'intent pour les contenus de message
  45. # Liste pour stocker l'historique des conversations
  46. conversation_history = []
  47. def load_conversation_history():
  48. global conversation_history
  49. if os.path.isfile(CONVERSATION_HISTORY_FILE):
  50. try:
  51. with open(CONVERSATION_HISTORY_FILE, 'r', encoding='utf-8') as f:
  52. conversation_history = json.load(f)
  53. logger.info(f"Historique chargé depuis {CONVERSATION_HISTORY_FILE}")
  54. except Exception as e:
  55. logger.error(f"Erreur lors du chargement de l'historique : {e}")
  56. conversation_history = []
  57. else:
  58. logger.info(f"Aucun fichier d'historique trouvé. Un nouveau fichier sera créé à {CONVERSATION_HISTORY_FILE}")
  59. def save_conversation_history():
  60. try:
  61. with open(CONVERSATION_HISTORY_FILE, 'w', encoding='utf-8') as f:
  62. json.dump(conversation_history, f, ensure_ascii=False, indent=4)
  63. except Exception as e:
  64. logger.error(f"Erreur lors de la sauvegarde de l'historique : {e}")
  65. # Charger l'encodeur pour le modèle GPT-4o
  66. encoding = tiktoken.get_encoding("o200k_base")
  67. # Convertir l'ID du channel en entier
  68. try:
  69. chatgpt_channel_id = int(DISCORD_CHANNEL_ID)
  70. except ValueError:
  71. raise ValueError("L'ID du channel Discord est invalide. Assurez-vous qu'il s'agit d'un entier.")
  72. class MyDiscordClient(discord.Client):
  73. async def close(self):
  74. global openai_client
  75. if openai_client is not None:
  76. await openai_client.close()
  77. openai_client = None
  78. await super().close()
  79. # Initialiser le client Discord avec les intents modifiés
  80. client_discord = MyDiscordClient(intents=intents)
  81. # Appeler la fonction pour charger l'historique au démarrage
  82. load_conversation_history()
  83. def resize_image(image_bytes, mode='high', attachment_filename=None):
  84. try:
  85. with Image.open(BytesIO(image_bytes)) as img:
  86. original_format = img.format # Store the original format
  87. if mode == 'high':
  88. # Redimensionner pour le mode haute fidélité
  89. img.thumbnail((2000, 2000))
  90. if min(img.size) < 768:
  91. scale = 768 / min(img.size)
  92. new_size = tuple(int(x * scale) for x in img.size)
  93. img = img.resize(new_size, Image.Resampling.LANCZOS)
  94. elif mode == 'low':
  95. # Redimensionner pour le mode basse fidélité
  96. img = img.resize((512, 512))
  97. buffer = BytesIO()
  98. img_format = img.format
  99. if not img_format:
  100. if attachment_filename:
  101. _, ext = os.path.splitext(attachment_filename)
  102. ext = ext.lower()
  103. format_mapping = {
  104. '.jpg': 'JPEG',
  105. '.jpeg': 'JPEG',
  106. '.png': 'PNG',
  107. '.gif': 'GIF',
  108. '.bmp': 'BMP',
  109. '.tiff': 'TIFF'
  110. }
  111. img_format = format_mapping.get(ext, 'PNG')
  112. else:
  113. img_format = 'PNG'
  114. img.save(buffer, format=img_format)
  115. return buffer.getvalue()
  116. except Exception as e:
  117. logger.error(f"Error resizing image: {e}")
  118. raise
  119. def is_long_special_text(text):
  120. # Vérifier que le texte est bien une chaîne de caractères
  121. if not isinstance(text, str):
  122. logger.error(f"Erreur : Le contenu n'est pas une chaîne valide. Contenu : {text}")
  123. return False
  124. # Compter le nombre de tokens dans le texte
  125. token_count = len(encoding.encode(text))
  126. # Définir un seuil pour considérer le texte comme long
  127. if token_count > 200:
  128. logger.info("Texte long détecté : %d tokens", token_count)
  129. return True
  130. return False
  131. def extract_text_from_message(message):
  132. content = message.get("content", "")
  133. if isinstance(content, list):
  134. # Extraire le texte de chaque élément de la liste
  135. texts = []
  136. for part in content:
  137. if isinstance(part, dict):
  138. text = part.get("text", "")
  139. if text:
  140. texts.append(text)
  141. return ' '.join(texts)
  142. elif isinstance(content, str):
  143. return content
  144. else:
  145. return ""
  146. def calculate_cost(usage):
  147. input_tokens = usage.get('prompt_tokens', 0)
  148. output_tokens = usage.get('completion_tokens', 0)
  149. # Coûts estimés
  150. input_cost = input_tokens / 1_000_000 * 5.00 # 5$ pour 1M tokens d'entrée
  151. output_cost = output_tokens / 1_000_000 * 15.00 # 15$ pour 1M tokens de sortie
  152. total_cost = input_cost + output_cost
  153. return input_tokens, output_tokens, total_cost
  154. def is_relevant_message(message):
  155. content = message["content"]
  156. if isinstance(content, list):
  157. content = ''.join(part.get('text', '') for part in content if 'text' in part)
  158. if len(content.strip()) < 5:
  159. return False
  160. discord_emoji_pattern = r'<a?:\w+:\d+>'
  161. def is_discord_emoji(part):
  162. return bool(re.fullmatch(discord_emoji_pattern, part))
  163. tokens = re.split(discord_emoji_pattern, content)
  164. emojis_only = True
  165. standard_emojis = [char for char in content if emoji.is_emoji(char)]
  166. discord_emojis = re.findall(discord_emoji_pattern, content)
  167. text_without_emojis = re.sub(discord_emoji_pattern, '', content)
  168. for char in text_without_emojis:
  169. if not char.isspace() and not emoji.is_emoji(char):
  170. emojis_only = False
  171. break
  172. if len(standard_emojis) + len(discord_emojis) == 0:
  173. emojis_only = False
  174. if emojis_only and len(content.strip()) > 0:
  175. return False
  176. return True
  177. async def read_text_file(attachment):
  178. file_bytes = await attachment.read()
  179. return file_bytes.decode('utf-8')
  180. async def encode_image_from_attachment(attachment, mode='high'):
  181. image_data = await attachment.read()
  182. resized_image = resize_image(image_data, mode=mode, attachment_filename=attachment.filename)
  183. return base64.b64encode(resized_image).decode('utf-8')
  184. async def summarize_text(text, max_tokens=50):
  185. summary_prompt = f"Résumé :\n\n{text}\n\nRésumé:"
  186. try:
  187. response = await openai_client.chat.completions.create(
  188. model="gpt-4o",
  189. messages=[
  190. {"role": "system", "content": "You are a helpful assistant."},
  191. {"role": "user", "content": summary_prompt}
  192. ],
  193. max_tokens=max_tokens # Limitez les tokens pour obtenir un résumé court
  194. )
  195. summary = response.choices[0].message.content.strip()
  196. if hasattr(response, 'usage'):
  197. usage_dict = {
  198. 'prompt_tokens': response.usage.prompt_tokens,
  199. 'completion_tokens': response.usage.completion_tokens
  200. }
  201. else:
  202. usage_dict = {}
  203. return summary, usage_dict
  204. except OpenAIError as e:
  205. logger.error(f"Error summarizing text: {e}")
  206. return text, {}
  207. except AttributeError as e:
  208. logger.error(f"Attribute error during summarization: {e}")
  209. return text, {}
  210. async def call_openai_api(user_text, user_name, image_data=None, detail='high'):
  211. # Préparer le contenu pour l'appel API
  212. message_to_send = {
  213. "role": "user",
  214. "content": [
  215. {"type": "text", "text": f"{user_name} dit : {user_text}"}
  216. ]
  217. }
  218. # Inclure l'image dans l'appel API courant
  219. if image_data:
  220. message_to_send["content"].append({
  221. "type": "image_url",
  222. "image_url": {
  223. "url": f"data:image/jpeg;base64,{image_data}",
  224. "detail": detail
  225. }
  226. })
  227. try:
  228. response = await openai_client.chat.completions.create(
  229. model="gpt-4o",
  230. messages=conversation_history + [message_to_send],
  231. max_tokens=400,
  232. temperature=1.1
  233. )
  234. if response:
  235. reply = response.choices[0].message.content
  236. # Ajouter le message de l'utilisateur à l'historique global, mais uniquement s'il ne s'agit pas d'une image
  237. if image_data is None:
  238. await add_to_conversation_history(message_to_send)
  239. # Ajouter la réponse de l'IA directement à l'historique
  240. await add_to_conversation_history({
  241. "role": "assistant",
  242. "content": reply
  243. })
  244. if hasattr(response, 'usage') and response.usage:
  245. usage = response.usage
  246. input_tokens, output_tokens, total_cost = calculate_cost({
  247. 'prompt_tokens': usage.prompt_tokens,
  248. 'completion_tokens': usage.completion_tokens
  249. })
  250. # Afficher dans la console
  251. logging.info(f"Coût de la réponse : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")
  252. return response
  253. except OpenAIError as e:
  254. logger.error(f"Error calling OpenAI API: {e}")
  255. except Exception as e:
  256. logger.error(f"Error calling OpenAI API: {e}")
  257. return None
  258. @client_discord.event
  259. async def on_ready():
  260. logger.info(f'Bot connecté en tant que {client_discord.user}')
  261. # Ajouter la personnalité de l'IA à l'historique au démarrage
  262. if not conversation_history:
  263. conversation_history.append({
  264. "role": "system",
  265. "content": PERSONALITY_PROMPT
  266. })
  267. save_conversation_history()
  268. # Envoyer un message de version dans le canal Discord
  269. channel = client_discord.get_channel(chatgpt_channel_id)
  270. if channel:
  271. try:
  272. embed = discord.Embed(
  273. title="Bot Démarré",
  274. description=f"🎉 Le ChatBot est en ligne ! Version {BOT_VERSION}",
  275. color=0x00ff00 # Vert
  276. )
  277. await channel.send(embed=embed)
  278. logger.info(f"Message de connexion envoyé dans le canal ID {chatgpt_channel_id}")
  279. except discord.Forbidden:
  280. logger.error(f"Permissions insuffisantes pour envoyer des messages dans le canal ID {chatgpt_channel_id}.")
  281. except discord.HTTPException as e:
  282. logger.error(f"Erreur lors de l'envoi du message de connexion : {e}")
  283. else:
  284. logger.error(f"Canal avec ID {chatgpt_channel_id} non trouvé.")
  285. @client_discord.event
  286. async def on_message(message):
  287. global conversation_history
  288. # Vérifier si le message provient du canal autorisé
  289. if message.channel.id != chatgpt_channel_id:
  290. return
  291. # Vérifier si l'auteur du message est le bot lui-même
  292. if message.author == client_discord.user:
  293. return
  294. user_text = message.content.strip()
  295. image_data = None
  296. file_content = None
  297. # Vérifier si le message est la commande de réinitialisation
  298. if user_text.lower() == "!reset_history":
  299. # Vérifier si l'utilisateur a les permissions administratives
  300. if not message.author.guild_permissions.administrator:
  301. await message.channel.send("❌ Vous n'avez pas la permission d'utiliser cette commande.")
  302. return
  303. # Réinitialiser l'historique en conservant uniquement le prompt de personnalité
  304. conversation_history = [{
  305. "role": "system",
  306. "content": PERSONALITY_PROMPT
  307. }]
  308. save_conversation_history()
  309. await message.channel.send("✅ L'historique des conversations a été réinitialisé.")
  310. logger.info(f"Historique des conversations réinitialisé par {message.author}.")
  311. return # Arrêter le traitement du message après la réinitialisation
  312. # Extensions de fichiers autorisées
  313. allowed_extensions = ['.txt', '.py', '.html', '.css', '.js']
  314. # Vérifier s'il y a une pièce jointe
  315. if message.attachments:
  316. for attachment in message.attachments:
  317. # Vérifier si c'est un fichier avec une extension autorisée
  318. if any(attachment.filename.endswith(ext) for ext in allowed_extensions):
  319. file_content = await read_text_file(attachment)
  320. break
  321. # Vérifier si c'est une image
  322. elif attachment.content_type in ['image/jpeg', 'image/png', 'image/gif', 'image/bmp', 'image/tiff']:
  323. image_data = await encode_image_from_attachment(attachment, mode='high')
  324. break
  325. # Ajouter le contenu du fichier à la requête si présent
  326. if file_content:
  327. user_text += f"\nContenu du fichier {attachment.filename}:\n{file_content}"
  328. # Appeler l'API OpenAI
  329. result = await call_openai_api(user_text, message.author.name, image_data)
  330. if result:
  331. reply = result.choices[0].message.content
  332. await message.channel.send(reply)
  333. async def add_to_conversation_history(new_message):
  334. # Extraire le texte du message
  335. if isinstance(new_message["content"], list) and len(new_message["content"]) > 0:
  336. content_text = new_message["content"][0].get("text", "")
  337. else:
  338. content_text = new_message.get("content", "")
  339. if not isinstance(content_text, str):
  340. logger.error(f"Erreur : Le contenu n'est pas une chaîne valide. Contenu : {content_text}")
  341. return
  342. if is_long_special_text(content_text):
  343. summary, usage = await summarize_text(content_text)
  344. new_message = {
  345. "role": new_message["role"],
  346. "content": summary
  347. }
  348. # Inclure le coût du résumé dans le calcul total
  349. input_tokens, output_tokens, total_cost = calculate_cost(usage)
  350. logging.info(f"Coût du résumé : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")
  351. # Filtrer les messages pertinents pour l'historique
  352. if is_relevant_message(new_message):
  353. # Ajouter le message à l'historique
  354. conversation_history.append(new_message)
  355. save_conversation_history()
  356. # Synthétiser les messages les plus anciens si l'historique est trop long
  357. if len(conversation_history) > 30:
  358. # Synthétiser les 20 plus anciens messages (exclure la personnalité et les 10 plus récents)
  359. messages_to_summarize = conversation_history[1:21] # Exclure le premier (personnalité)
  360. texts = [extract_text_from_message(msg) for msg in messages_to_summarize]
  361. texts = [text for text in texts if text]
  362. combined_text = ' '.join(texts)
  363. combined_token_count = len(encoding.encode(combined_text))
  364. if combined_token_count > 15000:
  365. encoded_text = encoding.encode(combined_text)
  366. truncated_text = encoding.decode(encoded_text[:500])
  367. combined_text = truncated_text
  368. logger.info(f"Combined text tronqué à 15 000 tokens.")
  369. synthesized_summary, usage = await summarize_text(combined_text, max_tokens=400)
  370. # Calculer le coût de la synthèse
  371. input_tokens, output_tokens, total_cost = calculate_cost(usage)
  372. logging.info(f"30 messages dans l'historique. Synthèse effectuée. Coût : ${total_cost:.4f} / Input: {input_tokens} / Output: {output_tokens} / Total: {input_tokens + output_tokens}")
  373. # Remplacer l'ancienne synthèse par la nouvelle
  374. # Conserver la personnalité et la nouvelle synthèse
  375. conversation_history[:] = [conversation_history[0], {"role": "system", "content": synthesized_summary}] + conversation_history[21:]
  376. save_conversation_history()
  377. # Démarrer le bot Discord
  378. client_discord.run(DISCORD_TOKEN)