You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
A questão não parece, contudo, trivial. Relaciona-se a questões amplas de design. Por exemplo, deve haver lemas diferentes para formas derivadas lexicalizadas com significado não mais composicional, como cabrita?
The text was updated successfully, but these errors were encountered:
leoalenc
changed the title
Forms related to _cabra_ and the problem of lemmatizing lexicalized diminutives
Forms related to "cabra" and the problem of lemmatizing lexicalized diminutives
Jun 10, 2021
Acho que seria bem complicado agora tentar aplicar ajustes nos recursos que usamos. Seja porque eles próprios já evoluíram ou porque ao longo destes anos nós já mudamos várias entradas que vieram deles.
Minha sugestão é sim pensarmos em quais testes de consistência podemos ter.
Para frente, precisamos definir o que são dados base/primitivos e o que são dados gerados por regras. De tal forma que, para os diminutivos e outras formas geradas por regras, teríamos uma maneira de reexecutar a geração a partir dos dados base/primitivos.
Em tempo, como ficarão os diminutivos na modelagem da PorGram? Seriam regras certo? E o que chamo acima de dados base seriam talvez as entradas lexicais no léxico.tdl e no arquivo das formas irregular.
@arademaker, continuando #79, temos:
~/MorphoBr/nouns$ grep -P "\tcabrito\+" nouns-a* ../diminutives/*.dict
Precisamos:
Os lemas, em princípio, são:
cabra+N+F
cabrita+N+F
cabrito+N+M
Existe também o cabra:
grep -P "\tcabra\+N\+M" nouns-a*
A questão não parece, contudo, trivial. Relaciona-se a questões amplas de design. Por exemplo, deve haver lemas diferentes para formas derivadas lexicalizadas com significado não mais composicional, como cabrita?
The text was updated successfully, but these errors were encountered: