Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PTPASS should be replaced by PTPST #81

Closed
leoalenc opened this issue May 4, 2021 · 10 comments
Closed

PTPASS should be replaced by PTPST #81

leoalenc opened this issue May 4, 2021 · 10 comments
Assignees

Comments

@leoalenc
Copy link
Contributor

leoalenc commented May 4, 2021

@arademaker, no DELAF_PB, K representa o particípio. Na atual versão do MorphoBr, só temos a etiqueta PTPASS, que é o particípio passivo. Não temos a etiqueta PTPST, que é o particípio passado. Enquanto grande parte dos verbos possui as duas formas, que diferem na valência, verbos intransitivos não apassiváveis como ser não possuem um PTPASS. O contrário, porém, é verdadeiro: todo verbo possui PTPST. Desse modo, proponho substituir PTPASS por PTPST. Essa questão é relevante para a discussão sobre a compatibilidade entre MorphoBr e UD.

@leoalenc leoalenc transferred this issue from LR-POR/tutorial May 4, 2021
@arademaker
Copy link
Contributor

Bom, ao fazer isso, estaremos deixando como pendências identificar quais verbos teriam o PTPASS, correto?

Para confirmar, vc está propondo transformar PTPASS em PTPST de forma global em todos os verbos certo?

ar@leme verbs % rg PTPASS * | wc -l
  138576

Confirmando eu vou rodar:

for f in *.dict; do 
awk 'BEGIN {OFS="\t"} $2 ~ /PTPASS/ {sub(/PTPASS/,"PTPST",$2); print $1,$2}' $f > $f.new; done

E temos que corrigir o arquivo TAGSET, certo? Está confuso porque lá falamos que o K do DELAF_PB é passive participle e não apenas participio. E passive participle (PTPST forms, i.e., past participles without gender and number tags, must be included) sugeri que PTPST estão inclusos nos PTPASS mas vc acima diz o contrário ne? Todos os verbos tem PTPST mas nem todos PTPASS.

@leoalenc
Copy link
Contributor Author

leoalenc commented May 6, 2021

Bom, ao fazer isso, estaremos deixando como pendências identificar quais verbos teriam o PTPASS, correto?

Para confirmar, vc está propondo transformar PTPASS em PTPST de forma global em todos os verbos certo?

@arademaker, sim.

ar@leme verbs % rg PTPASS * | wc -l
  138576

Confirmando eu vou rodar:

for f in *.dict; do 
awk 'BEGIN {OFS="\t"} $2 ~ /PTPASS/ {sub(/PTPASS/,"PTPST",$2); print $1,$2}' $f > $f.new; done

E temos que corrigir o arquivo TAGSET, certo? Está confuso porque lá falamos que o K do DELAF_PB é passive participle e não apenas participio. E passive participle (PTPST forms, i.e., past participles without gender and number tags, must be included) sugeri que PTPST estão inclusos nos PTPASS mas vc acima diz o contrário ne? Todos os verbos tem PTPST mas nem todos PTPASS.

@arademaker, sim, precisamos corrigir esse arquivo. Na documentação do DELAF_PB, temos:

G: Gerúndio
K: Particípio

Gerúndio são as formas em -ndo, como cantando, e particípio, formas em -do, como cantado. Agora me escapa por que converti K em PTPASS quando construímos o MorphoBr. Parece que na época eu estava preocupado com a análise da passiva na BrGram. As documentação de UD desrecomenda o termo gerúndio, preferindo particípio presente. Com isso na cabeça, sugeri agora PTPST para substituir PTPASS. Creio que podemos manter essa etiqueta, com a interpretação de UD, também adotada pela gramática de Mateus et al. (1989, p. 372), entre outras, ou seja, como a forma de particípio que se usa tanto para construir tempos do passado (por ex., eu tinha cantado) como a voz passiva (por ex., o hino foi cantado). Desse modo, na documentação, teríamos simplesmente o seguinte:

PTPST past participle

A diferença entre os dois particípios dos exemplos eu tinha cantado e o hino foi cantado diz respeito à valência, fenômeno fora da abrangencia do POS-tagging.
a propósito: Mateus et al. também usam o termo gerúndio para as formas em -ndo. A referência é esta:

MATEUS, M. H. M. et al. Gramática da língua portuguesa. 2. ed. Lisboa: Caminho, 1989.

@arademaker
Copy link
Contributor

arademaker commented May 6, 2021

O commit 5bb7c47 resolve este issue. Peço verificar. No arquivo TAGSET, poderíamos tentar acrescentar o mapeamento para UD talvez... E note ainda que poderiamos buscar algum link com https://unimorph.github.io, veja #54.

@leoalenc
Copy link
Contributor Author

leoalenc commented May 6, 2021

O commit 5bb7c47 resolve este issue. Peço verificar. No arquivo TAGSET, poderíamos tentar acrescentar o mapeamento para UD talvez... E note ainda que poderiamos buscar algum link com https://unimorph.github.io, veja #54.

@arademaker, seriam úteis esses mapeamentos, até tendo em vista a checagem do MorphoBr e do Bosque UD pela comparação entre os dois recursos.

@arademaker
Copy link
Contributor

OK, ja temos o issue para tratar disso. Por agora, queremos o mapeamento com UD.

leoalenc referenced this issue in LR-POR/tools May 12, 2021
@arademaker arademaker added this to the pre-release 1.0.0 milestone Aug 13, 2021
@analununes
Copy link
Contributor

@arademaker e @leoalenc, nos clíticos ainda existe a tag PTPASS, vamos atualizar?

provindo-a	provir+V.ele.ACC.3.F.SG+PTPASS
provindo-as	provir+V.ele.ACC.3.F.PL+GRD
provindo-as	provir+V.ele.ACC.3.F.PL+PTPASS

@analununes analununes reopened this Nov 3, 2021
@analununes analununes self-assigned this Nov 3, 2021
@leoalenc
Copy link
Contributor Author

leoalenc commented Nov 3, 2021

@arademaker e @leoalenc, nos clíticos ainda existe a tag PTPASS, vamos atualizar?

provindo-a	provir+V.ele.ACC.3.F.SG+PTPASS
provindo-as	provir+V.ele.ACC.3.F.PL+GRD
provindo-as	provir+V.ele.ACC.3.F.PL+PTPASS

@analununes , bem observado, sim, vamos. A tag PTPASS não será mais utilizada, apenas PTPST, que, conforme expliquei em comentário anterior, serve tanto para o particípio passivo quanto particípio passado.

@arademaker
Copy link
Contributor

Imagino que ao trocar a tag PTPASS por PTPST possam surgir entradas duplicadas (entradas PTPST já existentes) certo? Importante verificar isso.

@analununes
Copy link
Contributor

analununes commented Nov 4, 2021

Imagino que ao trocar a tag PTPASS por PTPST possam surgir entradas duplicadas (entradas PTPST já existentes) certo? Importante verificar isso.

Posso cuidar disso quando estiver trocando a tag.

@analununes
Copy link
Contributor

Conforme #118, problema de tag PTPASS no diretório de cliticos foi resolvido em 077f617

arademaker pushed a commit that referenced this issue Nov 6, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants