De volta à sintaxe de Matias Aires

8
www.ime.usp.br/~tycho/par ticipants/hbritto_page 1 De volta à sintaxe de Matias Aires Helena Britto (Unicamp) [email protected]

description

De volta à sintaxe de Matias Aires. Helena Britto (Unicamp) [email protected]. Rumo à anotação sintática. - PowerPoint PPT Presentation

Transcript of De volta à sintaxe de Matias Aires

Page 1: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

1

De volta à sintaxe de Matias Aires

Helena Britto (Unicamp)[email protected]

Page 2: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

2

Rumo à anotação sintática...

...para treinamento do analisador (parser) automático, desenvolvido no âmbito do projeto

Padrões Rítmicos, Fixação de Parâmetros e Mudança Linguística(Coord Charlotte Galves, FAPESP)

1999Inserido em um projeto de pesquisa que visa sobretudo a estudar a relação entremudança prosódica e mudança sintática no período do português comumente denominado clássico, o objetivo do Corpus Tycho Brahe é disponibilizar publicamente dados históricos do português europeu anotados de tal maneira que os estudiosos de sua história possam recuperar rápida e inambigüamente informações categoriais e estruturais pertinentes a análises morfo-sintáticas da língua. Segundo a metodologia proposta no Penn Corpus of Middle English, a etiquetagem morfológica dos textos constitui o primeiro passo deste processo de anotação, servindode base para a codificação sintática subseqüente.

(In Galves e Britto, 1999)

2002   O Corpus Tycho Brahe conta atualmente com 2,000,000 de palavras,

e o processo de anotação sintática inicia-se em parceria com a Universidade da Peinsilvânia

Page 3: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

3

Anotação sintática de Matias Aires...

...para primeiro treinamento do analisador (parser) automático,

por Helena Britto

(IP-MAT (VB-P Têm) (NP-SBJ (D-P os) (N-P homens)) (PP (P em) (NP (PRO si) (FP mesmos))) (NP-ACC (D-UM um) (N espelho) (ADJ-G fiel) (, ,) (CP-REL (WPP-5(P em) (WPRO que)) (IP-SUB (PP *T*-5) (NP-SBJ *pro*) (VB-P(VB-P vêem) (, ,) (CONJ e) (VB-P sentem)) (NP-ACC (D-F a) (N impressão) (...) (. :)) Matias Aires (1705-

1763)

Page 4: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

4

Primeiros resultados do parser

trecho do primeiro arquivo de saída do parser,

sem ainda qualquercorreção semi-automática

(IP (NP (D O) (N amor) (ADJ puro)) (, ,) (NP (ADJ belíssima) (NPR Genoveva)) (, ,) (SR é) (ADJP (Q muito) (ADJ raro)))

(IP (NP (D A) (N ocasião) (PP (P de) (IP (VB encontrá-lo) (, ,) (PP (P para) (IP (NP (CL vos)) (VB fazer) (NP (D a) (N pintura))))))) (, ,) (SR é) (ADJP (Q muito) (ADJ dificultosa)))

(IP (NEG Não) (VB sabeis) (CP (CP (C que) (IP (NP (D o) (N amor)) (VB passa) (PP (P em) (NP (N ideia))))) (CONJP (CONJ e) (CP (C que) (, ,) (IP (IP (SR sendo) (ADJP (ADJ semelhante) (PP (P à) (NP (N visão) (PP (P dos) (NP (N espíritos))))))) (, ,) (NP (Q todo) (D o) (N mundo)) (VB fala) (PP (P dele)) (, ,) (PP (ADV talvez) (P sem) (IP (HV haver) (PP (P no) (NP (N mundo))) (NP (CP (WNP (WPRO quem)) (IP (NP (NP (CL o))) (VB conheça)))))))))))

Page 5: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

5

Anotação e análise sintáticas

Enriquecendo o rol de tópicos de estudos em Teoria Gramatical Notas sobre clivadas Dados I E se muda,é só de espécie. (In Matias Aires 1705-1763) Dados II*Essas coisas que eu disse foi para mostrar que... *Isso que eu disse foi para mostrar que...*O que eu disse foi para mostrar que ... (In Matias Aires 1705-1763)

[[O que eu disse]i [eu disse cvi] foi para mostrar que...] [eu disse o que eu disse foi para mostrar que ...]

PrincípioApenas o constituinte clivado nunca pode ser não realizado

foneticamente, pois, para além do componente interpretativo, porta informação relevante para o componente fonético- fonológico; sobre o restante da construção o princípio não se aplica

Page 6: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

6

Das clivadas...

... a critério para distinção entre estas e sentenças that (IP-MAT (NP-SBJ (D-F A)

(N vaidade))(VB-P+SE-1 parece-se)(NP-SE (SE *ICH*-1)) (Q muito)(PP (P com) (NP (D o) (N amor-próprio)))(, ,)(CP-ADV (CONJS se) (IP-SUB (NP-SBJ (EX *exp*)

(CP-THT *EXP*-9)) (SR-P é) (CP-THT-9 (C que)

(IP-SUB (NP-SBJ *pro*) (NEG não)

(SR-P é) (NP-ACC (D o)

(ADJ mesmo))))))(. ;))

Page 7: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

7

A sintaxe do senão I

Como adverbial

(CP-QUE (CONJ e)(PP (P com) (NP (N efeito)))(, ,)(WADVP-12

(WADV quando)) (IP-MAT (ADVP *T*-12) (NP-SBJ-8 *pro*)

(NP-SE *-8 (SE se)) (VB-D viu) (CP-ADV (IP-SUB (NP-SBJ elliptical)

(SENAO senão) (ADV agora)))

(, ,) (IP-INF (VB+SE-5 sentar-se)

(NP-SE (SE *ICH*-5)) (PP (P+D no) (NP (ADJ mesmo)

(NPR Trono))) (NP-SBJ (NP (NP (D-F a)

(NPR Soberania)) (CONJP (CONJ e)

(NP (D-F a) (NPR Benignidade))))

Page 8: De volta à sintaxe de Matias Aires

www.ime.usp.br/~tycho/participants/hbritto_page

8

A sintaxe do senão I

Como partícula de foco

(...)(ADV já)(NP-1 (CL me))(NEG não)(VB-P posso)(IP-INF (NP-ACC *ICH*-1)

(VB emendar) (PP (P por) (NP (D-F esta)

(N vez))))(, ,)(PP (SENAO senão) (P com) (IP-INF(VB prometer)

(, ,) (CP-THT (C que)