-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
novos lemas verbais do dhbb #74
Comments
Eu não produzi uma lista específica dos possíveis verbos que não constam no MorphoBr, os que encontrei, foi olhando mesmo.... teve o "zerar" que de fato não existe no morphoBr e o "freqüentar" (com trema) que existe no morphoBr mas sem a trema, então não está de fato faltando. |
Bem, não temos O que Lucas fez foi rodar https://github.com/cpdoc/dhbb-nlp/blob/master/udp/not_in_morpho.sh e obter esta lista https://github.com/cpdoc/dhbb-nlp/blob/master/udp/verbs.not_in_morpho! Mas UDPipe comete errors como
Ou seja, ele errou o lema de |
OK. Melhorei um pouco o script do comentário acima. Gerei dois arquivos, um que os dados dhbb de verbos são comparados por lemma com o morphobr, e outro onde são comparados por forma flexionada. |
hmm, nao entendi o que aconteceu com downcasing do script. porque de 9.3K casos em |
Correto, erros de lemmatização do UDPipe, por isso o |
mas isso nao ajuda, nao e'? o que a gente quer (eu suponho) e' descobrir lemas que realmente estao faltando no Morpho. exemplos como "frequentar" com trema sao faceis de corrigir (vc pode simplesmente grep os verbos com "qu" e adicionar a forma com trema (que acho agora esta' errada, ms estava correta ate o ultimo acordo BR-PT). o que 'e interessante 'e descobrir exemplos como "zerar" que esta' no wiktionary (https://en.wiktionary.org/wiki/zerar) e tb no OWN-PT http://wn.mybluemix.net/synset?id=00297507-v |
@lucasrct , pode apontar aqui para script e listas que vc produziu de possíveis verbos faltando no MorphoBr?
The text was updated successfully, but these errors were encountered: