Paris, novembre 2001
Soit P un ensemble de phonèmes de la langue L.
Chaque mot de cette langue, composé de n phonèmes de P peut être vu comme un élément de Pn. Par exemple, aphasique º [afasik] º ( [a], [f],[a],[s],[i],[k] ) Î P6
Pour tout mot m de L, notons f(m) l’expression phonétique de m.
Soit WL= f(L) = { f(m ) | mÎL }
La densité phonétique de L dans un ensemble E (fini, non vide) est le rapport du nombre de mots de L exprimables dans E et du nombre d’éléments de E :
dE(L) = card(WLÇE) / card(E)
Nous utiliserons un alphabet phonétique simplifié. On ne pourra pas exprimer phonétiquement tous les mots de langue anglaise et de la langue française avec ces symboles. Cet alphabet a pour unique objet de situer l’étude à une intersection approximative de l’espace phonétique anglais et français.
[b] bas
[k] cas
[d] dos
[f] fa
[g] guis
[l] la
[m] ma
[n] ne
[p] pas
[r] rat
[s] sa
[t] ta
[v] va
[z] zoo
[a] art
[è] aime
[i] il
[o] or
[u] ours
Pour notre étude comparative, nous utiliserons un ensemble E très petit (196 éléments).
E = C x { [a] } x C avec C = { [b], [k], [d], [f], [g], [l], [m], [n], [p], [r], [s], [t], [v], [z] }
card(E) = card(C) . card({[a]}) . card(C) = 14 . 1 . 14 = 196
E représente donc l’ensemble des « assemblages » de 3 phonèmes dont le premier et le dernier appartient à C et celui du milieu est [a]. J’ai choisi cet ensemble arbitrairement.
Notons F la langue française, et A la langue anglaise. Calculons dE(F) et dE(A).
[a] |
[b] |
[k] |
[d] |
[f] |
[g] |
[l] |
[m] |
[n] |
[p] |
[r] |
[s] |
[t] |
[v] |
[z] |
[b] |
* |
bac |
* |
baffe |
bague |
balle |
* |
* |
* |
barre |
basse |
batte |
bave |
base |
[k] |
* |
* |
* |
* |
* |
cale |
came |
canne |
cape |
car |
casse |
* |
cave |
case |
[d] |
* |
* |
* |
* |
dague |
dalle |
dame |
damne |
* |
dard |
* |
date |
* |
* |
[f] |
* |
fac |
fade |
faf |
* |
* |
femme |
fane |
* |
fard |
fasse |
fate |
* |
phase |
[g] |
* |
* |
* |
gaffe |
gag |
gale |
gamme |
* |
* |
gare |
* |
gatte |
gave |
gaz |
[l] |
* |
lac |
lad |
* |
* |
* |
lame |
* |
lape |
lard |
lace |
latte |
lave |
* |
[m] |
* |
mac |
* |
* |
* |
malle |
* |
manne |
* |
mare |
masse |
matte |
* |
* |
[n] |
* |
* |
* |
* |
* |
* |
* |
* |
nappe |
narre |
nasse |
natte |
* |
nase |
[p] |
* |
pack |
* |
paf |
* |
pale |
pâme |
pane |
pape |
part |
passe |
patte |
pave |
* |
[r] |
rabe |
* |
rade |
* |
rague |
râle |
rame |
* |
râpe |
rare |
race |
ratte |
rave |
rase |
[s] |
* |
sac |
* |
* |
* |
sale |
* |
* |
sape |
sar |
sas |
* |
* |
* |
[t] |
Tab |
tac |
* |
taffe |
Tag |
tale |
* |
tanne |
tape |
tare |
tasse |
tâte |
* |
* |
[v] |
* |
vaque |
* |
* |
vague |
val |
* |
vanne |
* |
* |
* |
* |
* |
vase |
[z] |
* |
* |
* |
* |
* |
* |
* |
* |
zappe |
* |
* |
* |
* |
* |
légende:
mot : pas vraiment du français ?
* : je n’ai pas trouvé de mot correspondant au triplet.
dE(F) = 101 / 196 » 0,515
Densité du français dans E » 52%
Approximations phonétiques :
Anglais
[a] |
[b] |
[k] |
[d] |
[f] |
[g] |
[l] |
[m] |
[n] |
[p] |
[R] |
[s] |
[t] |
[v] |
[z] |
[b] |
bab |
back |
bad |
baff |
bag |
bale |
bam |
ban |
bap |
bar |
bass |
batt |
* |
baz |
[k] |
cab |
cack |
cad |
caff |
* |
kal |
cam |
can |
cap |
car |
case |
cat |
cave |
* |
[d] |
dab |
dack |
dad |
daff |
dag |
dall |
dam |
dan |
dap |
dare |
dace |
date |
dave |
daze |
[f] |
fab |
fake |
fad |
* |
fag |
fail |
fam |
fan |
* |
far |
face |
fat |
fave |
phase |
[g] |
gab |
gack |
gad |
gaff |
gag |
gal |
gam |
gan |
gap |
gar |
gas |
gat |
gave |
gaze |
[l] |
lab |
lack |
lad |
* |
lag |
* |
lam |
lane |
lap |
* |
lass |
lat |
lav |
laze |
[m] |
* |
mac |
mad |
* |
mag |
mal |
mam |
man |
map |
mar |
mass |
mat |
* |
maze |
[n] |
nab |
nack |
* |
naff |
nag |
nal |
name |
nan |
nap |
nare |
* |
nat |
nave |
* |
[p] |
* |
pack |
pad |
* |
* |
pal |
* |
pan |
pap |
par |
pass |
pat |
pave |
* |
[R] |
* |
rack |
rad |
* |
rag |
* |
ram |
ran |
rap |
rare |
race |
rat |
rave |
raze |
[s] |
* |
sac |
sad |
safe |
sag |
sal |
same |
sane |
sat |
* |
* |
sat |
save |
* |
[t] |
tab |
tack |
tad |
* |
tag |
tale |
tam |
tan |
tap |
tar |
* |
tat |
* |
* |
[v] |
* |
vac |
* |
* |
vag |
* |
* |
van |
* |
* |
vas |
vat |
* |
vase |
[z] |
* |
zack |
zad |
* |
* |
* |
* |
* |
zap |
* |
* |
* |
* |
* |
légende:
word : approximation
phonétique.
word : je ne suis pas certain de la prononciation
word : pas vraiment de l’anglais.
* : je n’ai pas trouvé de mot correspondant au triplet.
Se reporter au lexique à la fin du document pour le sens de chaque mot. L’outil Babylon a été utilisé pour cette recherche. Babylon est un « broker » de définitions sur internet. (voir babylon.com)
En trichant un peu (c’est à dire en acceptant les approximations phonétiques):
dE(A) = 141 / 196 = 0,75
densité de l’anglais dans E = 75%
Sans tricher :
dE(A) = 103 / 196 » 0,526…
densité de l’anglais dans E » 53%
Conclusion,
si on n’accepte pas d’approximation phonétique, on trouve la même densité pour
les deux langues. Si on accepte une approximation sur le [a], on obtient une
densité sensiblement plus élevée dans le cas de l’anglais.
Pour un résultat réellement significatif, il faudrait un ensemble E beaucoup plus grand. Cette étude ne permet pas de quantifier précisément la densité phonétique du français et de l’anglais. Le but de ce document est simplement d’expliquer cette notion et la manière de procéder pour son évaluation sur un ensemble E donné.
Pour une étude complète, il faudrait E tel que WFÌ E et WAÌ E. En conséquence, un parcours automatisé de dictionnaires phonétiques des deux langues s’imposerait.
En un sens, pour une langue donnée, la densité phonétique quantifie la qualité surjective dans l’espace des phonèmes. Un autre travail intéressant serait de quantifier la qualité injective, c’est-à-dire la rareté des homonymies.
lexique (pour chaque mot, une des acceptions)
bab porte (Arab origin)
back dos
bad mauvais
baff taper dans la terre au golf (Scottish origin)
bag sac
bale ballot
bam connard (Scottish use)
ban bannir
bap petit pain rond au lait
bar barre
bass basse
batt batterie
baz poil pubien (Everyday
English)
cab taxi
cack excrément (English slang)
cad mufle
caff café (slang)
cam came
can pouvoir
cap bouchon
car voiture
case cas
cat chat
cave grotte
dab tape
dace vandoise
dack défroquer (Australian slang)
dad papa
daff jonquille
dag excentrique
(Australian slang)
dall aveugle
(Irish Gaelic)
dam digue
dan danois
dap poignée de main (slang)
dare oser
date date
dave se
raser (Australian slang)
daze stupéfaction
fab sensas
face figure
fad manie
fag corvée
fail échouer
fake truqué
fam famille (Australian
slang)
fan ventilateur
far loin
fat gros
fave favori (Australian slang)
gab bavarder
gack idiot
(Everyday English)
gad vagabonder
gaff harpon
gag gag
gal jeune fille
gam groupe de baleines
gan sans (Irish Gaelic)
gap créneau
gar près (Irish Gaelic)
gas essence
gat pistolet
gave donna
gaze regard fixe
kal beau (Interlingua English)
lab labo
lack manque
lad garçon
lag retard
lam évasion
lane voie
lap genoux
lass jeune fille
lat latitude
lav petit
coin
laze oisiveté
mac imper
mad fou
mag magazine
mal le mal
mam maman
man homme
map plan
mar endommager
mass masse
mat mat
maze labyrinthe
nab voler
nack importuner (Australian slang)
naff pas cher, mais toc (London slang)
nag harceler
nal fer à cheval (Khowar
English)
nam pour (Interlingua-English)
name nom
nan nana
nap somnolence
nare narine (Interlingua-English)
nat être né (Interlingua-English)
nave moyeu
pack paquet
pad tapisserie
pal copain
pan casserole
pap mamelon
par parité
pass passer
pat taper
pave paver
phase phase
race race
rack armoire
rad radical
(English Idiom)
rag chiffon
ram bélier
ran coururent
rap tape
rare rare
rat rat
rave délirer
raz * temps (Clockwork orange slang)
raze détruire
sac sac
sad triste
saf * tout
(Khowar English)
safe sûr
sag affaissement
sal volatile
sam * confiture (Australian Slang)
same identique
san * sain
(Interlingua-English)
sane sain
sap sévère
sat assis
sav incroyable ( Australian
slang)
save sauver
tab étiquette
tack punaise
tad gosse
tag etiquette
tal
* tel (Interlingua-English)
tale conte
tam béret écossais
tan bronzage
tap robinet
tar goudron
tass * tasse ( Clockwork orange slang)
tat tissu grossier
vac vacances
vag vagabond (Australian
slang)
van fourgon
vas vaisseau
(anatomie)
vase vase
vat cuve
zack 5 cents (Australian
slang)
zad bossu (Dictionary of the Vulgar Tongue)
zap détruire
* : mots non employés dans le tableau anglais.