Supprimé des sources qui ne fonctionnent plus
authorEric Mc Sween <eric.mcsween@auf.org>
Mon, 8 Dec 2014 21:28:12 +0000 (16:28 -0500)
committerEric Mc Sween <eric.mcsween@auf.org>
Mon, 8 Dec 2014 21:28:12 +0000 (16:28 -0500)
auf_savoirs_en_partage/backend_config.py
auf_savoirs_en_partage/savoirs/lib/harvesters/oai/generic.py

index 90968e0..1941273 100644 (file)
@@ -12,11 +12,6 @@ RESOURCES = {
         'acces': 'generic',
         'url': 'http://eprints.aidenligne-francais-universite.auf.org/',
     },
         'acces': 'generic',
         'url': 'http://eprints.aidenligne-francais-universite.auf.org/',
     },
-    u'Centredoc-Org': {
-        'type': 'oai',
-        'acces': 'generic',
-        'url': 'http://doc.refer.org/',
-    },
     u'Bibliothèque Numérique de Ouagadougou': {
         'type': 'oai',
         'acces': 'generic',
     u'Bibliothèque Numérique de Ouagadougou': {
         'type': 'oai',
         'acces': 'generic',
@@ -32,32 +27,11 @@ RESOURCES = {
         'acces': 'generic',
         'url': 'http://biblio.critaoi.auf.org/'
     },
         'acces': 'generic',
         'url': 'http://biblio.critaoi.auf.org/'
     },
-    u'Archives ouvertes du Moyen-Orient': {
-        'type': 'oai',
-        'acces': 'generic',
-        'url': 'http://hal-confremo.archives-ouvertes.fr/'
-    },
     u'CECA': {
         'type': 'oai',
         'acces': 'generic',
         'url': 'http://ceca.auf.org/',
     },
     u'CECA': {
         'type': 'oai',
         'acces': 'generic',
         'url': 'http://ceca.auf.org/',
     },
-    u'Journal de la Société de biologie clinique': {
-        'type': 'oai',
-        'acces': 'generic',
-        'url': 'http://revues.temp.bj.refer.org/index.php/JSBC/',
-    },
-    u'Le Bénin Médical': {
-        'type': 'oai',
-        'acces': 'generic',
-        'url': 'http://revues.temp.bj.refer.org/index.php/BM/',
-    },
-    u'Annales des l\'Université de Parakou : '
-    u'Série sciences naturelles et agronomie': {
-        'type': 'oai',
-        'acces': 'generic',
-        'url': 'http://revues.temp.bj.refer.org/index.php/A-UPAR-SNA/',
-    },
     u'Archives de l\'Agence universitaire de la Francophonie': {
         'type': 'oai',
         'acces': 'generic',
     u'Archives de l\'Agence universitaire de la Francophonie': {
         'type': 'oai',
         'acces': 'generic',
@@ -132,28 +106,4 @@ RESOURCES = {
         'acces': 'html09',
         'url': 'http://www.bulletin.auf.org/',
     },
         'acces': 'html09',
         'url': 'http://www.bulletin.auf.org/',
     },
-    u'Religec': {
-        'type': 'lodel',
-        'acces': 'html09',
-        'url': 'http://www.religec.org/',
-    },
-    #'Exchorésis': {
-    #    'type': 'lodel',
-    #    'acces': 'html',
-    #    'url': 'http://exchoresis.refer.ga/',
-    #},
-
-    # SPIP
-    #'Annales des sciences agronomiques du Bénin': {
-    #    'type': 'lodel',
-    #    'acces': 'html',
-    #    'url': 'http://www.annales-fsa.bj.refer.org/',
-    #},
-
-    # SPIP
-    #'Bulletin des OSCB': {
-    #    'type': 'lodel',
-    #    'acces': 'html',
-    #    'url': 'http://www.osc.bj.refer.org/',
-    #},
 }
 }
index 3c49f78..7dacca6 100644 (file)
@@ -41,7 +41,7 @@ def connect(url):
 def find_location (url_str):
     url = urlparse(url_str)
 
 def find_location (url_str):
     url = urlparse(url_str)
 
-    possible = ("perl/oai2", "cgi/oai2", "cgi-bin/oaiserver", "oai/oai.php",
+    possible = ("", "perl/oai2", "cgi/oai2", "cgi-bin/oaiserver", "oai/oai.php",
                 "oai/oai2.php", "oai/")
     for test in possible:
         path = url.path + test
                 "oai/oai2.php", "oai/")
     for test in possible:
         path = url.path + test
@@ -60,7 +60,7 @@ def load_xml (url):
     ud.close ()
     
     encoding = chardet.detect(original)['encoding']
     ud.close ()
     
     encoding = chardet.detect(original)['encoding']
-    content = original.decode(encoding)
+    content = original.decode(encoding or 'utf-8')
 
     # Greenstone crap
     content = content.replace ("\"http://www.openarchives.com/OAI/2.0\"",
 
     # Greenstone crap
     content = content.replace ("\"http://www.openarchives.com/OAI/2.0\"",