]> gitweb.pimeys.fr Git - bots/parrot.git/blobdiff - quotes.py
On fait le ménage en dumpant pas des espaces
[bots/parrot.git] / quotes.py
index c1aca7617cbe1017cb4dc128c1b64b628e126a89..5c1a58ebbd4330230334cb91c821a4296dda9a1a 100644 (file)
--- a/quotes.py
+++ b/quotes.py
@@ -13,37 +13,71 @@ import config
 
 quote_matcher = re.compile(config.quote_regexp, flags=re.UNICODE)
 quote_matcher_with_timestamp = re.compile(config.quote_regexp_with_timestamp, flags=re.UNICODE)
+spaces_matcher = re.compile(u"\s", flags=re.U)
+
+def equivalence_partition(iterable, relation):
+    """ Partitionne l'itérable en classes d'équivalences. """
+    classes = []
+    for o in iterable:
+        # find the class it is in
+        found = False
+        for c in classes:
+            if relation( iter(c).next(), o ): # is it equivalent to this class?
+                c.add( o )
+                found = True
+                break
+        if not found: # it is in a new class
+            classes.append( set( [ o ] ) )
+    return classes
 
 def get_now():
     """ Renvoie la date actuelle """
     return datetime.datetime(*time.localtime()[:6])
 
+def sanitize_author(raw):
+    """Proprifie l'auteur : enlève les espaces insécables."""
+    return spaces_matcher.sub(u" ", raw)
+
 class Quote(object):
     """ Une citation """
-    def __init__(self, author, content, timestamp=None):
+    def __init__(self, author, content, timestamp=None, place=None, quoter=None):
         if timestamp is None:
             timestamp = get_now()
         elif isinstance(timestamp, basestring):
             timestamp = datetime.datetime(*time.strptime(timestamp, u"%Y-%m-%d_%H:%M:%S")[:6])
-        self.author = author
+        self.author = sanitize_author(author)
         self.content = content
         self.timestamp = timestamp
+        self.place = place
+        self.quoter = quoter
     
     def jsonize(self):
         d = {"author" : self.author, "content" : self.content,
-             "timestamp" : self.timestamp.strftime(u"%F_%T")}
+             "timestamp" : self.timestamp.strftime(u"%F_%T"),
+             "place" : self.place, "quoter" : self.quoter}
         return d
     
     def __unicode__(self):
         """ Retourne la quote affichable """
-        return config.quote_template % self.__dict__
+        if self.place and self.place.strip() != u"":
+            return config.quote_template_withcontext % self.__dict__
+        else:
+            return config.quote_template % self.__dict__
     def __str__(self):
         return unicode(self).encode("utf-8")
     
+    def full_str(self):
+        """ Retourne une chaîne représentant la totalité des infos de la quote,
+            tout en étant parsable et human-readable. """
+        place = self.place if self.place and self.place.strip() != u"" else u""
+        quoter = self.quoter if self.quoter and self.quoter.strip() != u"" else u""
+        return (u"%s %s | %s | %s" % (self.timestamp.strftime("%F_%T"), config.quote_template % self.__dict__
+                  , place, quoter)).encode("utf-8")
+    
     def __eq__(self, otherquote):
         """ Vérifie si cette phrase n'a pas déjà été dite par la même personne.
-            Indépendamment de la date. """
-        return [self.author, self.content] == [otherquote.author, otherquote.content]
+            Indépendamment de la date et de la casse. """
+        return [self.author.lower(), self.content.lower()] == [otherquote.author.lower(), otherquote.content.lower()]
 
 
 def parse(text, date=None):
@@ -81,24 +115,49 @@ class QuoteDB(object):
         """ Sauvegarde la DB dans le fichier de quotes """
         save_file(self.quotelist, config.quote_file)
     
-    def store(self, author, content, timestamp=None):
+    def _collapse_author(self, author):
+        """ Renvoie ``author`` avec la casse déjà utilisée si il a déjà été quoté
+            sinon, le renvoie sans le modifier. """
+        authors = list(set([q.author for q in self.quotelist if q.author.lower() == author.lower()]))
+        if len(authors) > 1:
+            print "Warning : authors %s" % authors
+        if authors:
+            return authors[0]
+        else:
+            return author
+    
+    def get_clash_authors(self):
+        """ Renvoie une liste de liste d'auteurs qui sont enregistrés avec des casses différentes. """
+        authors = list(set([q.author for q in self.quotelist]))
+        authors = equivalence_partition(authors, lambda x,y: x.lower() == y.lower())
+        authors = [list(c) for c in authors if len(c) > 1]
+        return authors
+    
+    def store(self, timestamp=None, **kwargs):
         """ Enregistre une nouvelle quote, sauf si elle existe déjà.
+            Force l'auteur à utiliser la même casse si un auteur de casse différente existait déjà.
             Renvoie ``True`` si elle a été ajoutée, ``False`` si elle existait. """
-        newquote = Quote(author, content, timestamp)
+        kwargs["author"] = self._collapse_author(kwargs["author"])
+        kwargs["timestamp"] = timestamp
+        newquote = Quote(**kwargs)
         if not newquote in self.quotelist:
             self.quotelist.append(newquote)
             return True
         return False
-
+    
     def __repr__(self):
         return repr(self.quotelist)
-
+    
     def random(self):
         """ Sort une quote aléatoire """
         return random.choice(self.quotelist)
+
+    def quotesfrom(self, author):
+        """ Sort toutes les quotes de ``author`` """
+        return [q for q in self.quotelist if q.author == author]
     def randomfrom(self, author):
         """ Sort une quote aléatoire de ``author`` """
-        return random.choice([q for q in self.quotelist if q.author == author])
+        return random.choice(self.quotesfrom(author))
     
     def search(self, inquote=None, author=None, regexp=False):
         """Fait une recherche dans les quotes."""
@@ -117,9 +176,9 @@ class QuoteDB(object):
                 author = ""
             l = [q for q in self.quotelist if inquote in q.content and author in q.author]
         return l
-
+    
     def search_authors(self, author=None, regexp=False):
-        """Renvoie la liste des auteur contenant ``author`` ou qui matchent la regexp."""
+        """Renvoie la liste des auteurs contenant ``author`` ou qui matchent la regexp."""
         if regexp:
             if author is None:
                 author = ".*"
@@ -135,7 +194,7 @@ def dump(quotedb, dump_file=None):
     """Pour exporter les quotes dans un format readable vers un fichier."""
     if dump_file is None:
         dump_file = config.quote_dump_file
-    t = "\n".join(["%s %s" % (q.timestamp.strftime("%F_%T"), q) for q in quotedb.quotelist]) + "\n"
+    t = "\n".join([q.full_str() for q in quotedb.quotelist]) + "\n"
     with open(dump_file, "w") as f:
         f.write(t)