14/11/2013
1
La lingüística forense
Jordi Cicres
ForensicLab – Laboratori de lingüística forense
Institut Universitari de Linguística Aplicada
Universitat Pompeu Fabra
Índex
• Introducció (definició, epistemologia, història, àmbits d’actuació)
• Exemples de casos reals
– Identificació de parlants
– Autenticació de gravacions
– Anàlisi del plagi
– Determinació de l’autoria de textos escrits
• Una mirada al futur
Introducció •Lingüística general:
- Models descriptius
•Lingüística forense:
- Especialitzada.
- Aplicada (problem-based).
- De suport per a una millor administració de la justícia
La lingüística forense
L’anàlisi del llenguatge jurídic i judicial (the language of the law)
L’estudi del llenguatge del procediment judicial (the language of the court)
L’anàlisi del llenguatge amb l’objectiu d’aportar proves en un procediment judicial (forensic linguistic evidence)
Lingüística forense
Lingüística teòrica i
descriptiva
Lingüística computacional
Estadística Informàtica
Enginyeria
Dret
Variació lingüística individual
Variació entre individus
Variació entre els grups
(sociolingüística)
14/11/2013
2
Variació lingüística individual
< Variació entre individus
< Variació entre els grups
(sociolingüística)
IDIOLECTE
'uniqueness of utterance principle'
(Chomsky 1965; Halliday 1975)
• Nolan (1994: 331): “even within a narrowly defined dialect community, individuals will have their own preferred detailed pronunciations of particular words. The combination of number of such preferred alternative pronunciations yields an overall pronunciation which is idiosyncratic, [and] that is, an individual’s idiolect”
• (Burridge y Mulder, 1998: 302): “variation within a language that is associated with individual speakers”
• Brown (1982: 16): “An idiosyncratic feature is one which cannot be correlated with group factors such as sex, age, regional origin, social status, health, etc.”.
HISTÒRIA
• 1968. Jan Svartvik: Cas de Timothy John Evans.
• Anàlisi de les suposades declaracions del sospitós fetes davant la policia. Mitjançant anàlisi descriptiva i estadística, es va demostrar que les declaracions havien estat manipulades per la policia.
• Apareix per primer cop el terme “Lingüística Forense”.
Comparació forense de veus (Identificació de parlants)
• La variació intraparlant (within-speaker) i interparlant (between-speaker)
14/11/2013
3
• Les dimensions més importants són les que presenten una variació intraparlant petita i una variació interparlant gran.
• Cal calcular la ràtio de variació entre parlants respecte de la variació dins del parlant.
• Aquesta ràtio és la F-ratio, i es calcula mitjançant l’anàlisi de variància (ANOVA)
• En variables no quantitatives s’utilitzen altres tècniques estadístiques
14/11/2013
4
• Reducció de la quantitat de dades disponibles
–Transmissió telefònica
–Soroll de fons
–Mitjà de gravació (qualitat pèssima)
–Durada de les mostres
• Material de treball:
– Número de mostres
– Número de dimensions
– Mida de les dimensions
Quins paràmetres es
poden comparar
per discriminar veus
en fonètica forense?
INFORMACIÓ
EN LA PARLA
QUALITAT VOCAL
COMPONENT
ORGÀNIC
COMPONENT
(O AJUSTAMENT)
ARTICULATORI
QUALITAT
FONÈTICA
LINGÜÍSTIQUES NO LINGÜÍSTIQUES
AUDITIVES AUDITIVES-
LINGÜÍSTIQUES
AUDITIVES-NO LINGÜÍSTIQUES
ACÚSTIQUES ACÚSTIQUES-
LINGÜÍSTIQUES
ACÚSTIQUES-NO LINGÜÍSTIQUES
14/11/2013
5
Variables
Fonètiques
(no lingüístiques)
Segmentals
Propietats acústiques dels segments
Vocals, nasals, laterals, oclusives, fricatives,
ròtiques...
Suprasegmentals
Freqüència fonamental, ritme, entonació, alineació tonal, velocitat de la parla,
qualitat de la veu
Lingüístiques
Fonologia, morfologia, sintaxi, etc.
Dialecte, sociolecte, L1/L2, accent estranger, fonotaxi...
Referents a la “manera de parlar”
Hàbits verbals (pauses omplertes), hàbits no
verbals (clics, riures, tos), comportament respiratori
Frequency (Hz)500 16000
-40
-20
0
Frequency (Hz)500 16000
-40
-20
0
Frequency (Hz)
500 16000
-40
-20
0
Frequency (Hz)
500 16000
-40
-20
0
Frequency (Hz)
500 16000
-40
-20
0
Frequency (Hz)
500 16000
-40
-20
0
F3
F2
F1
14/11/2013
6
14/11/2013
7
VARIABILITAT
SOCIOLINGÜÍSTICA INDIVIDUAL
• Accent regional (dialecte)
• Accent regional (dialecte)
• Accent social (sociolecte)
• Accent regional (dialecte)
• Accent social (sociolecte)
• Influència d’altres llengües
• Cas Prinzivalli:
– la veu de Prinzivalli (indubitada) i la veu
dubitada coincidien amb un F0 molt
més baix que la mitjana
• Cas Prinzivalli:
– diferències dialectals entre l’accent de
Nova York (origen de Prinzivalli) i de
Nova Anglaterra
14/11/2013
8
• Cas Prinzivalli:
– diferències dialectals entre l’accent de
Nova York (origen de Prinzivalli) i de
Nova Anglaterra
– indetectable pels policies de Los
Angeles
• Cas Prinzivalli:
– diferències dialectals entre l’accent de
Nova York (origen de Prinzivalli) i de
Nova Anglaterra
– indetectable pels policies de Los
Angeles
– -r (no es pronuncia a Nova York)
• Variació sociolingüística:
• Variació sociolingüística:
– sexe
• Variació sociolingüística:
– sexe
– edat
• Variació sociolingüística:
– sexe
– edat
– classe social (factor socioeconòmic)
– nivell educatiu
14/11/2013
9
• Variació sociolingüística:
– sexe
– edat
– classe social (factor socioeconòmic)
– nivell educatiu
– ètnia
– camp/ciutat
• Exemple: -/r/ en anglès
– [r]
–Ø
car, hear, November, flower
Parlant Parla
espontània
Parla
acurada
Lectura
d’un
passatge
Lectura
d’una llista
de paraules
Lectura de
parells
mínims
BN 0 0 13 33 33
JP 0 3 23 53 50
SK 0 6 8 38 100
DH 0 31 44 69 100
AG 12 15 46 100 100
ML 32 47 39 56 100
Percentatge de realitzacions plenes [r] en diferents contexts lingüístics de
formalitat en 6 parlants de Nova York
• En anglès nord americà, a major formalitat major presència de [r]
• En anglès britànic, a major formalitat,
major ocurrència Ø
ELS LÍMITS
ADN
• Invariable (en el temps, en mostres diferents)
• Jurídicament inqüestionable
• Ràtio d’error baixa
MOSTRES DE VEU
• Variables (en el temps, en mostres diferents)
• Reticències judicials
• Ràtio d’error més gran
Autenticació de gravacions
14/11/2013
10
14/11/2013
11
• La importància d’una bona transcripció:
http://elpais.com/diario/2007/06/05/espana/1180994413_850215.html
Determinació d’autoria de textos escrits
Tècniques amb base sintàctica
BÍGRAMS / TRÍGRAMS
CORPUS ANOTATS
MORFOLÒGICAMENT
A PARTIR DE LES FORMES SUPERFICIALS
Bígram Text 1 Text 2 ...
no me 5 0 ...
, que 4 6 ...
el hombre 3 2 ...
. y 3 4 ...
a su 3 4 ...
su señora 2 0 ...
, como 2 3 ...
me he 2 3 ...
no me 5 0 ...
Morpho-syntactically Annotated Tag Sequences (MATS)
14/11/2013
12
Un exemple d’atribució d’autoria
Una empresa del sector turístic de Catalunya és acusada d’acomiadament improcedent per part d’un empleat que suposadament l’havia intentat extorsionar.
L’extorsió apareix en una sèrie d’e-mails,. L’empleat diu que no els ha enviat ell.
L’empleat reconeix haver enviat una sèrie de faxos durant aquells dies.
S’utilitza com a corpus indubitat els faxos, i els e-mails com a corpus dubitat.
TD@
Doc01 Doc02 Doc03 Doc04
TIFax
Doc05 Doc06 Doc07 Doc08
• Temporalitat i cronologia
• 1. doc01 (TD@)
‘(…) y más de 6.000 litros de gasoil de
calefacción’.
(22 de setembre de 2003).
• 2. doc05 (TIfax)
‘(…) llegando a consumir 6.000 litros de gasoil’ (…)’.
(28 de setembre de 2003)
• Errors ortogràfics
• 3. doc06 (TIfax)
‘(…) una de las personas que más a
trabajado para la XXX’.
• 4. doc03 (TD@)
‘(…) el cual siempre me a demostrado su
interés (…)’.
14/11/2013
13
• Errors gramaticals
• 5. doc07 (TIfax)
(…) ‘al cual la empresa le han pagado’.
• 6. doc01 (TD@)
(…) ‘no creo que hayan muchas
personas’).
• Contacte de llengües
• i) La caiguda de la preposició ‘de’ en contextos en els quals el seu ús és obligatori en castellà estàndard. Ex.: ‘en el caso ^ que’ (doc05 TIfax), ‘se dio cuenta ^ que tenía en sus manos’ (doc02 TD@).
• ii) La caiguda de la preposició ‘a’, en contextos en els quals el seu ús és obligatori en castellà estàndard per indicar el complement directe: ‘para atender ^ los clientes’ (doc08 TIfax).
L’ús dels corpus de referència per A/D d’autoria
Danielle Jones nena desapareguda
David Hodgson oncle
14/11/2013
14
Plagi
SISTEMA LEGAL
COMMON LAW CIVIL LAW
Gran tradició de litigi
per temes de plagi. Els
lingüistes actuen
de pèrits
- “Intertextualitat”
- Reticències per acceptar
evidències lingüístiques
Unitat, globalitat, coherència/cohesió
Estil Descontextualització
14/11/2013
15
Gradació dels elements estructurals Nivell de similitud
Vocabulari coincident
– En textos sobre una mateixa temàtica
– En traduccions
Un exemple de plagi en la traducció
• Cas jutjat
• El 1993, Vázquez Montalbán va ser declarat culpable (sentència 1268 del Tribunal Suprem, Madrid, 29 de desembre del 1993) d’haver plagiat la traducció al castellà de Pujante del Julius Caesar de Shakespeare (Espasa Calpe, 1987)
Corpus
• Astrana Marín (1961)
• Valverde (1968)
• Pujante (1987)
– la traducció plagiada
• Vázquez Montalbán (1988)
– la traducción qüestionada
Copycatch
Anàlisi quantitativa
% de vocabulari comú
Núm. de paraules únicas compartides
14/11/2013
16
Número de sintagmes compartits d’aparició única (longitud dels sintagmes: 3 elements) Anàlisi qualitativa
I CANNOT DRINK TOO MUCH OF BRUTUS’ LOVE.
A. Jamás beberé lo bastante por el afecto de Bruto.
V. No puedo beber suficiente del cariño de Bruto.
P. Jamás podré apurar la amistad de Bruto.
VM. Jamás podré apurar la amistad de Bruto.
GOOD MORROW, BRUTUS
A. Buenos días, Bruto.
V. Buenos días, Bruto.
P. Buenas noches, Bruto.
VM. Buenas noches, Bruto.
HAVE WISHED THAT NOBLE BRUTUS HAS HIS EYES.
A. suspirar por que el noble Bruto abriese los ojos.
V. han deseado que el noble Bruto tuviera sus ojos.
P. y quisieran que Bruto no fuese tan ciego.
VM. y quisieran que Bruto no fuese tan ciego.
A TRADE, SIR, THAT I HOPE I MAY USE WITH A SAFE CONSCIENCE
A. Un oficio, señor, que espero podré ejercer con la conciencia tranquila,
V. De un oficio, señor, que espero se me agradezca con buen consuelo:
P. Señor, un oficio que siempre hace el bien.
VM. Señor, un oficio que siempre hace el bien.
Top Related