Paris, novembre 2001

 

La densité phonétique

 

 

Soit P un ensemble de phonèmes de la langue L.

Chaque mot de cette langue, composé de n phonèmes de P peut être vu comme un élément de Pn. Par exemple, aphasique º [afasik] º ( [a], [f],[a],[s],[i],[k] ) Î P6

Pour tout mot m de L, notons f(m) l’expression phonétique de m.

Soit WL= f(L) = { f(m ) | mÎL }

La densité phonétique de L dans un ensemble E (fini, non vide) est le rapport du nombre de mots de L exprimables dans E et du nombre d’éléments de E :

 dE(L) = card(WLÇE) / card(E)

 

Nous utiliserons un alphabet phonétique simplifié. On ne pourra pas exprimer phonétiquement tous les mots de langue anglaise et de la langue française avec ces symboles. Cet alphabet a pour unique objet de situer l’étude à une intersection approximative de l’espace phonétique anglais et français.


 

[b]       bas

[k]       cas

[d]       dos

[f]        fa

[g]        guis

[l]         la

[m]       ma

[n]        ne

[p]       pas

[r]        rat

[s]        sa

[t]        ta

[v]        va

[z]        zoo

 

[a]        art

[è]        aime   

[i]         il

[o]       or

[u]        ours


 

Pour notre étude comparative, nous utiliserons un ensemble E très petit (196 éléments).

E = C x { [a] } x C avec C = { [b], [k], [d], [f], [g], [l], [m], [n], [p], [r], [s], [t], [v], [z] }

card(E) = card(C) . card({[a]}) . card(C) = 14 . 1 . 14  =  196

E représente donc l’ensemble des « assemblages » de 3 phonèmes dont le premier et le dernier appartient à C et celui du milieu est [a]. J’ai choisi cet ensemble arbitrairement.

 

Notons F la langue française, et A la langue anglaise. Calculons dE(F) et dE(A).

 

Français

[a]

[b]

[k]

[d]

[f]

[g]

[l]

[m]

[n]

[p]

[r]

[s]

[t]

[v]

[z]

[b]

*

bac

*

baffe

bague

balle

*

*

*

barre

basse

batte

bave

base

[k]

*

*

*

*

*

cale

came

canne

cape

car

casse

*

cave

case

[d]

*

*

*

*

dague

dalle

dame

damne

*

dard

*

date

*

*

[f]

*

fac

fade

faf

*

*

femme

fane

*

fard

fasse

fate

*

phase

[g]

*

*

*

gaffe

gag

gale

gamme

*

*

gare

*

gatte

gave

gaz

[l]

*

lac

lad

*

*

*

lame

*

lape

lard

lace

latte

lave

*

[m]

*

mac

*

*

*

malle

*

manne

*

mare

masse

matte

*

*

[n]

*

*

*

*

*

*

*

*

nappe

narre

nasse

natte

*

nase

[p]

*

pack

*

paf

*

pale

pâme

pane

pape

part

passe

patte

pave

*

[r]

rabe

*

rade

*

rague

râle

rame

*

râpe

rare

race

ratte

rave

rase

[s]

*

sac

*

*

*

sale

*

*

sape

sar

sas

*

*

*

[t]

Tab

tac

*

taffe

Tag

tale

*

tanne

tape

tare

tasse

tâte

*

*

[v]

*

vaque

*

*

vague

val

*

vanne

*

*

*

*

*

vase

[z]

*

*

*

*

*

*

*

*

zappe

*

*

*

*

*

 

légende:

mot      : pas vraiment du français ?

*          : je n’ai pas trouvé de mot correspondant au triplet.

 

dE(F) = 101 / 196 »  0,515

Densité du français dans E » 52%

 

Approximations phonétiques :


Anglais

[a]

[b]

[k]

[d]

[f]

[g]

[l]

[m]

[n]

[p]

[R]

[s]

[t]

[v]

[z]

[b]

bab

back

bad

baff

bag

bale

bam

ban

bap

bar

bass

batt

*

baz

[k]

cab

cack

cad

caff

*

kal

cam

can

cap

car

case

cat

cave

*

[d]

dab

dack

dad

daff

dag

dall

dam

dan

dap

dare

dace

date

dave

daze

[f]

fab

fake

fad

*

fag

fail

fam

fan

*

far

face

fat

fave

phase

[g]

gab

gack

gad

gaff

gag

gal

gam

gan

gap

gar

gas

gat

gave

gaze

[l]

lab

lack

lad

*

lag

*

lam

lane

lap

*

lass

lat

lav

laze

[m]

*

mac

mad

*

mag

mal

mam

man

map

mar

mass

mat

*

maze

[n]

nab

nack

*

naff

nag

nal

name

nan

nap

nare

*

nat

nave

*

[p]

*

pack

pad

*

*

pal

*

pan

pap

par

pass

pat

pave

*

[R]

*

rack

rad

*

rag

*

ram

ran

rap

rare

race

rat

rave

raze

[s]

*

sac

sad

safe

sag

sal

same

sane

sat

*

*

sat

save

*

[t]

tab

tack

tad

*

tag

tale

tam

tan

tap

tar

*

tat

*

*

[v]

*

vac

*

*

vag

*

*

van

*

*

vas

vat

*

vase

[z]

*

zack

zad

*

*

*

*

*

zap

*

*

*

*

*

 

légende:

word    : approximation phonétique.

word    : je ne suis pas certain de la prononciation

word    : pas vraiment de l’anglais.

*          : je n’ai pas trouvé de mot correspondant au triplet.

 

Se reporter au lexique à la fin du document pour le sens de chaque mot. L’outil Babylon a été utilisé pour cette recherche. Babylon est un « broker » de définitions sur internet. (voir babylon.com)

 

En trichant un peu (c’est à dire en acceptant les approximations phonétiques):

dE(A) = 141 / 196 =  0,75

densité de l’anglais dans E = 75%

 

Sans tricher :

dE(A) = 103 / 196 »  0,526…

densité de l’anglais dans E » 53%

 

Conclusion, si on n’accepte pas d’approximation phonétique, on trouve la même densité pour les deux langues. Si on accepte une approximation sur le [a], on obtient une densité sensiblement plus élevée dans le cas de l’anglais.

Pour un résultat réellement significatif, il faudrait un ensemble E beaucoup plus grand. Cette étude ne permet pas de quantifier précisément la densité phonétique du français et de l’anglais. Le but de ce document est simplement d’expliquer cette notion et la manière de procéder pour son évaluation sur un ensemble E donné.

Pour une étude complète, il faudrait E tel que WFÌ E et WAÌ E. En conséquence, un parcours automatisé de dictionnaires phonétiques des deux langues s’imposerait.

En un sens, pour une langue donnée, la densité phonétique quantifie la qualité surjective dans l’espace des phonèmes. Un autre travail intéressant serait de quantifier la qualité injective, c’est-à-dire la rareté des homonymies.


lexique (pour chaque mot, une des acceptions)


bab      porte (Arab origin)

back    dos

bad      mauvais

baff      taper dans la terre au golf (Scottish origin)

bag      sac

bale      ballot

bam     connard (Scottish use)

ban      bannir

bap      petit pain rond au lait

bar       barre

bass     basse

batt      batterie

baz       poil pubien (Everyday English)

cab      taxi

cack     excrément (English slang)

cad      mufle

caff      café (slang)

cam      came

can       pouvoir

cap      bouchon

car       voiture

case     cas

cat       chat

cave     grotte

dab      tape

dace     vandoise

dack    défroquer (Australian slang)

dad      papa

daff      jonquille

dag      excentrique (Australian slang)

dall       aveugle (Irish Gaelic)

dam     digue

dan      danois

dap      poignée de main (slang)

dare     oser

date     date

dave     se raser (Australian slang)

daze     stupéfaction

fab       sensas

face      figure

fad        manie

fag        corvée

fail        échouer

fake     truqué

fam       famille (Australian slang)

fan       ventilateur

far        loin     

fat        gros

fave      favori (Australian slang)

gab      bavarder

gack     idiot (Everyday English)

gad      vagabonder

gaff      harpon

gag       gag

gal        jeune fille

gam      groupe de baleines

gan       sans (Irish Gaelic)

gap      créneau

gar       près (Irish Gaelic)

gas       essence

gat       pistolet

gave     donna

gaze     regard fixe

kal       beau (Interlingua English)

lab       labo

lack      manque

lad       garçon

lag        retard

lam       évasion          

lane      voie

lap       genoux

lass      jeune fille       

lat        latitude

lav        petit coin

laze      oisiveté

mac      imper

mad     fou

mag      magazine

mal       le mal

mam     maman

man      homme

map     plan

mar      endommager

mass    masse

mat      mat

maze    labyrinthe

nab      voler

nack     importuner (Australian slang)

naff      pas cher, mais toc (London slang)

nag       harceler

nal        fer à cheval (Khowar English)

nam      pour (Interlingua-English)

name    nom

nan       nana

nap      somnolence

nare     narine (Interlingua-English)

nat       être né (Interlingua-English)

nave     moyeu

pack    paquet

pad      tapisserie

pal       copain

pan      casserole

pap      mamelon

par       parité

pass     passer

pat       taper

pave     paver

phase   phase

race     race

rack     armoire

rad       radical (English Idiom)

rag       chiffon

ram      bélier

ran       coururent

rap       tape

rare      rare

rat        rat

rave     délirer

raz *    temps (Clockwork orange slang)

raze      détruire

sac       sac

sad       triste

saf *     tout (Khowar English)

safe      sûr

sag       affaissement

sal        volatile

sam *   confiture (Australian Slang)

same    identique

san *    sain (Interlingua-English)

sane     sain

sap       sévère

sat        assis

sav       incroyable ( Australian slang)

save     sauver

tab       étiquette

tack     punaise

tad       gosse

tag       etiquette

tal *     tel (Interlingua-English)

tale       conte

tam      béret écossais

tan       bronzage

tap       robinet

tar        goudron

tass *   tasse ( Clockwork orange slang)

tat        tissu grossier

vac       vacances

vag       vagabond (Australian slang)

van       fourgon

vas       vaisseau (anatomie)

vase     vase

vat       cuve

zack     5 cents (Australian slang)

zad       bossu (Dictionary of the Vulgar Tongue)

zap       détruire


 

* : mots non employés dans le tableau anglais.