L'historique du projet


L'idée de constitution d'un THESAURUS OCCITAN remonte au colloque de Wégimont organisé par l'
Association Internationale d'Etudes Occitanes (AIEO) en avril 1989 et consacré aux "Outils de la recherche occitane". Parmi les conclusions de ce colloque figure l'idée que l'une des fonctions essentielles de l'AIEO consiste à susciter et à soutenir quelques chantiers spécifiques dans le domaine des études occitanes susceptibles de dynamiser et de fédérer les énergies de recherche et d'aboutir à l'élaboration d'outils de pédagogie et de recherche à mettre à la disposition de la communauté. Le THESOC est basé au laboratoire "Bases, Corpus, Langage" (UMR 7320 CNRS-Université Nice Sophia Antipolis)

retour au sommaire

Les objectifs du THESOC

Le THESOC est un outil de travail à la disposition des chercheurs, des pédagogues et du public. Il comporte deux volets :

1. Des ressources : mots, textes, sons, images

C’est un TRESOR rassemblant une multitude de données linguistiques occitanes, qui procèdent toutes de sources orales.

– données linguistiques et périlinguistiques issues d’enquêtes de terrain

• cartes et carnets d’enquête des Atlas linguistiques
• monographies
• enregistrements sonores
• documents iconographiques

– données linguistiques procédant d'analyses déjà réalisées

• dans le domaine de la lemmatisation
• dans le domaine morphologique
• dans le domaine étymologique etc...

– données bibliographiques

 

2. Des outils d’analyse

• représentations cartographiques
• instruments d’analyse diachronique
• procédures de cartographie comparative
• instruments d’analyses morphologique, syntaxique, etc...

C’est un objet "à géométrie variable" qui, au delà de la consultation des faits, permet d’envisager toutes sortes d’exploitations et de recherches, grâce à des menus spécifiques et des modalités d'accès très diverses.
NB : Toutes ces fonctionnalités ne sont pas encore disponibles sur ce site. Elles seront implémentées progressivement.

retour au sommaire


Les assises institutionnelles du programme

Se trouvent associés :
— un réseau inter-universitaire (Aix-Nice-Toulouse + Lyon)
— le CNRS
— la Communauté Européenne (Direction Générale XXII)
— le Ministère de l’Education Nationale
— le Ministère de la Culture et de la Communication (DGLFLF)
— les Régions Midi-Pyrénées et Provence-Alpes-Côte d'Azur

Cette liste est et restera ouverte.

La centralisation et la synthèse des résultats s’effectuent à Nice dans le cadre de l’UMR 7320 CNRS-Université Nice Sophia Antipolis, au sein de l'équipe Dialectologie, Diachronie, Phonologie

retour au sommaire

Les acteurs du THESOC

Concepteurs : Jean-Philippe DALBERA, Marie-José DALBERA-STEFANAGGI, Dominique STRAZZABOSCO


Responsables :
Michèle OLIVIÉRI, Jean-Philippe DALBERA

Ingénieurs : Guylaine BRUN-TRIGAUD (traitement des données), Pierre-Aurélien GEORGES (développement informatique)

Equipe : Guylaine BRUN-TRIGAUD, Elisabetta CARPITELLI, Sylvain CASAGRANDE, Marie-José DALBERA-STEFANAGGI, Philippe DEL GIUDICE, Pierre-Aurélien GEORGES, Jean-Pierre LAI, Albert MALFATTO, Lucia MOLINU, Michèle OLIVIÉRI, Jean-Claude RANUCCI.

Collaborateurs : Patrick SAUZET (Toulouse), Franck FLORICIC (Paris), Sabina CANOBBIO, Tullio TELMON, Piersimone AVENA et Matteo RIVOIRA (Turin), Georg A. KAISER et Michael Zimmermann (Constance), David HEAP (London, Ontario).

Anciens collaborateurs : Jean-Claude BOUVIER, Claude MARTEL et Jacques TOURREL (Aix-en-Provence), Jean-Louis FOSSAT, Lidia RABASSA et Xavier RAVIER (Toulouse), Jean-Baptiste MARTIN, Dominique STICH et Michel BERT (Lyon), Jean-Claude POTTE, Marie-Rose SIMONI-AUREMBOU, Christine COLLOMB, Ekaterina OVTCHINNIKOVA, Virginie FERRAT-MOURET, Laurent REVEST et les étudiants de DEA et de Master en Sciences du langage (Nice), Kathryn KLINGEBIEL (Hawaï).

retour au sommaire



Les données du THESOC

 Les faits figurant dans la base proviennent pour l'essentiel de deux sources :

– Les atlas Linguistiques de la France par régions :

ALAL :     POTTE J. C., Atlas Linguistique et ethnographique de l'Auvergne et du Limousin, Paris, Editions du CNRS, 1975-1992.
ALCe :     DUBUISSON P., Atlas Linguistique et ethnographique du Centre, Paris, Editions du CNRS, 1971-1982.
ALG :       SEGUY J., Atlas Linguistique et ethnographique de la Gascogne, Paris, Editions du CNRS, 1954-1974.
ALLOc :   RAVIER X., Atlas Linguistique et ethnographique du Languedoc Occidental, Paris, Editions du CNRS, 1978-1993
ALLOr :   BOISGONTIER J., Atlas Linguistique et ethnographique du Languedoc Oriental, Editions du CNRS, 1981-1986.
ALLy :     GARDETTE P., Atlas Linguistique et ethnographique du Lyonnais, Paris, Editions du CNRS, 1967-1976.
ALMC :    NAUTON P., Atlas Linguistique et ethnographique du Massif Central, Paris, Editions du CNRS, 1955-1961.
ALO :       MASSIGNON G., HORIOT B., Atlas Linguistique et ethnographique de l'Ouest, Paris, Editions du CNRS, 1971-1983.
ALP :       BOUVIER J. C., MARTEL C., Atlas Linguistique et ethnographique de la Provence, Editions du CNRS, 1975-1986.

– Les enquêtes réalisées dans les Alpes-Maritimes par l'équipe de dialectologie dirigée par J.Ph. DALBERA ; ces données sont signalées par le sigle "PAM" (Parlers des Alpes-Maritimes).

retour au sommaire

Conventions de transcriptions

LEMMES

Le lemme est conçu comme forme de référence (conventionnelle) ; il sous-tend tout le faisceau de variantes consignées dans la base.
Le choix du lemme est effectué en s'appuyant sur le Dictionnaire Occitan-Français d'Alibert (DOF); sa notation respecte donc les principes de la graphie alibertine.
Alibert, L. 1966. Dictionnaire occitan-français d'après les parlers languedociens. Toulouse: IEO.

Quatre cas peuvent néanmoins se présenter, que nous explicitons ci-dessous en même temps que nous indiquons les conventions de notation:

(1) Le lemme se trouve dans le DOF avec le sens consigné dans la base : AUCUNE INDICATION.

exemples :
– BESSON attesté dans la base avec le sens de "jumeau" figure dans le DOF avec la même valeur : besson
– PICAR attesté dans la base avec le sens de "frapper" figure dans le DOF avec la même valeur : picar
– ARANHA attesté dans la base avec le sens d'"araignée" figure dans le DOF avec la même valeur : aranha

(2) Le lemme figure dans le DOF mais le sens spécifique consigné dans la base n'est pas indiqué ; on est en présence d'une approximation.
NOTATION : symbole ° après le lemme.

exemples :
– ESTARANHA attesté dans la base avec le sens d'"araignée" ne figure dans le DOF qu'avec le sens de "toile d'araignée" : estaranha°
– BOSIGA attesté dans la base avec le sens de "jachère" ne figure dans le DOF qu'avec le sens de "essart, défrichement" : bosiga°
– ESCORPIU attesté dans la base avec le sens d'"araignée" ne figure dans le DOF qu'avec le sens de "scorpion ou scolopendre" : escorpiu°

(3) Le lemme ne figure pas dans le DOF mais la base lexicale s'y trouve, représentée avec d'autres affixes. NOTATION : symbole °° après le lemme.

exemples :
– BOCHIN attesté dans la base avec le sens de "petite boule en buis servant de but" ne figure pas dans le DOF, mais bòcha s'y trouve avec le sens de "boule" : bochin°°
– SAUMIN attesté dans la base avec le sens d'"ânon" ne figure pas dans le DOF, mais sauma, saumilh, saumèl s'y trouvent avec des sens liés à "âne" : saumin°°
– MAJE attesté dans la base avec le sens d'"aîné" ne figure pas dans le DOF, mais major s'y trouve avec ce sens : maje°°

 

(4) Le lemme ne figure pas dans le DOF, hors homonymes. NOTATION : symbole * après le lemme.

exemples :
– TONDOL attesté dans la base avec le sens d'"assiette" ne figure pas dans le DOF : tondol*
– BARBA attesté dans la base avec le sens d'"oncle" ne figure pas dans le DOF ; on y trouve bien l'entrée barba mais avec le sens de "barbe" : barba*
– BRANDA attesté dans la base avec le sens d'"eau-de-vie" ne figure pas dans le DOF ; on y trouve bien l'entrée branda mais avec le sens de "haie" : branda*

 

PHONIE
La forme phonique est une transcription phonétique selon l'Alphabet Phonétique International (API).
Notons cependant quelques écarts par rapport aux normes de l'API :

(1) Pour des raisons de tri informatique, l'accent est noté devant la voyelle et non devant la syllabe accentuée.

(2) Dans la conversion entre les divers systèmes de transcription phonétique des auteurs des atlas, certains symboles ont été provisoirement conservés tels quels. Nous donnons ici la correspondance avec l'API ([a] représentant toute voyelle).

(3) À la suite des auteurs des atlas, nous avons conservé trois degrés de nasalisation des voyelles (faible, moyenne et intense), notées comme suit ([a] représentant toute voyelle) :

 

GRAPHIE
La forme graphique est une transcription "phonologisante" (intermédiaire entre la transcription phonétique de l'Alphabet Phonétique International et la graphie alibertine), qui adopte pour l'essentiel les principes du Tresor dou felibrige de Mistral.
Mistral, F. (1878). Lou Tresor dou Felibrige ou Dictionnaire Provençal-Français. Aix-en-Provence.

 

retour au sommaire

Recherche par mot

Cette page permet de lister les termes recueillis à une question précise dans toute l'Occitanie.

retour au sommaire

 

Recherche par localité ou département

Cette page permet de lister les termes recueillis dans une localité donnée, soit la totalité (liste complète), soit pour une question précise (recherche par mot).

retour au sommaire

 

Cartographie

Cette page doit permettre de visualiser sous forme de carte les données recueillies pour une question précise. Cependant, faute de moyens, cette fonctionnalité n'a pas pu encore être implémentée sur ce site : seul un exemple de carte est donc disponible pour l'instant.

retour au sommaire


Nous contacter

retour à l'accueil