Ajouté des stopwords à la recherche par mots-clés.
authorEric Mc Sween <eric.mcsween@gmail.com>
Tue, 30 Nov 2010 21:35:39 +0000 (16:35 -0500)
committerEric Mc Sween <eric.mcsween@gmail.com>
Tue, 30 Nov 2010 21:37:59 +0000 (16:37 -0500)
auf_savoirs_en_partage/scripts/sphinx.conf.py.in
auf_savoirs_en_partage/sql/2010-11-26.sql
auf_savoirs_en_partage/stopwords.txt [new file with mode: 0644]

index 04687b0..1823a1f 100644 (file)
@@ -76,6 +76,7 @@ index %%(name)s
                     U+F9->u, U+FB->u, U+FC->u
     source = %%(name)s
     path = %%(path)s
+    stopwords = %(directory)s/auf_savoirs_en_partage/stopwords.txt
 }''' %% dict(name=name, path=os.path.join(DATA_DIR, name))
 
 emit_source('savoirsenpartage_ressources', 
@@ -162,7 +163,7 @@ emit_source('savoirsenpartage_chercheurs',
                       r.nom AS region,
                       r.id AS region_id,
                       GROUP_CONCAT(DISTINCT d.nom_discipline) AS disciplines,
-                      CONCAT_WS(pub1.titre, pub2.titre, pub3.titre, pub4.titre) AS publications,
+                      GROUP_CONCAT(DISTINCT pub.titre) AS publications,
                       t.titre AS these,
                       GROUP_CONCAT(DISTINCT g.nom) AS groupes,
                       GROUP_CONCAT(DISTINCT ex.nom) AS expertises,
@@ -182,11 +183,8 @@ emit_source('savoirsenpartage_chercheurs',
                LEFT JOIN ref_pays pays ON pays.id = IFNULL(et.pays, c.etablissement_autre_pays)
                LEFT JOIN ref_region r ON pays.region = r.id
                LEFT JOIN discipline d ON d.id_discipline = c.discipline
-               LEFT JOIN chercheurs_publication pub1 ON pub1.id = c.publication1
-               LEFT JOIN chercheurs_publication pub2 ON pub2.id = c.publication2
-               LEFT JOIN chercheurs_publication pub3 ON pub3.id = c.publication3
-               LEFT JOIN chercheurs_publication pub4 ON pub4.id = c.publication4
-               LEFT JOIN chercheurs_publication t ON t.id = c.these
+               LEFT JOIN chercheurs_publication pub ON pub.chercheur_id = c.id
+               LEFT JOIN chercheurs_these t ON t.chercheur_id = c.id
                LEFT JOIN chercheurs_chercheurgroupe cg ON cg.chercheur = c.id
                LEFT JOIN chercheurs_groupe g ON g.id = cg.groupe
                LEFT JOIN chercheurs_expertise ex ON ex.chercheur_id = c.id
index ae0b80e..6b4dd57 100644 (file)
@@ -44,9 +44,12 @@ ALTER TABLE chercheurs_chercheur
     DROP COLUMN publication3,
     DROP COLUMN publication4;
 
+ANALYZE TABLE chercheurs_chercheur;
+
 -- On ne peut pas à la fois forcer une clé unique sur le courriel et conserver
 -- les comptes inactifs dans la table.
 
 ALTER TABLE chercheurs_personne
     DROP KEY courriel,
     ADD KEY courriel (courriel);
+
diff --git a/auf_savoirs_en_partage/stopwords.txt b/auf_savoirs_en_partage/stopwords.txt
new file mode 100644 (file)
index 0000000..372f840
--- /dev/null
@@ -0,0 +1,163 @@
+au
+aux
+avec
+ce
+ces
+dans
+de
+des
+du
+elle
+en
+et
+eux
+il
+je
+la
+le
+leur
+lui
+ma
+mais
+me
+même
+mes
+moi
+mon
+ne
+nos
+notre
+nous
+on
+ou
+par
+pas
+pour
+qu
+que
+qui
+sa
+se
+ses
+son
+sur
+ta
+te
+tes
+toi
+ton
+tu
+un
+une
+vos
+votre
+vous
+c
+d
+j
+l
+m
+n
+s
+t
+y
+été
+étée
+étées
+étés
+étant
+suis
+es
+est
+sommes
+êtes
+sont
+serai
+seras
+sera
+serons
+serez
+seront
+serais
+serait
+serions
+seriez
+seraient
+étais
+était
+étions
+étiez
+étaient
+fus
+fut
+fûmes
+fûtes
+furent
+sois
+soit
+soyons
+soyez
+soient
+fusse
+fusses
+fût
+fussions
+fussiez
+fussent
+ayant
+eu
+eue
+eues
+eus
+ai
+as
+avons
+avez
+ont
+aurai
+auras
+aura
+aurons
+aurez
+auront
+aurais
+aurait
+aurions
+auriez
+auraient
+avais
+avait
+avions
+aviez
+avaient
+eut
+eûmes
+eûtes
+eurent
+aie
+aies
+ait
+ayons
+ayez
+aient
+eusse
+eusses
+eût
+eussions
+eussiez
+eussent
+ceci
+celà 
+cet
+cette
+ici
+ils
+les
+leurs
+quel
+quels
+quelle
+quelles
+sans
+soi