Academic literature on the topic 'Etiquetagem morfossintática'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Etiquetagem morfossintática.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Etiquetagem morfossintática"

1

Othero, Gabriel de Ávila, and Mônica Rigo Ayres. "Anotação morfológica automática de corpus de língua falada: desafios ao Aelius." Texto Livre: Linguagem e Tecnologia 7, no. 2 (2014): 44–60. http://dx.doi.org/10.17851/1983-3652.7.2.44-60.

Full text
Abstract:
RESUMO: Apresentamos, neste artigo, nosso trabalho de anotação morfológica automática de trechos de um corpus de língua falada – pertencentes ao projeto Varsul –, utilizando um etiquetador automático morfossintático gratuito, o Aelius, em 20 textos, perfazendo um total de 154.530 palavras. Basicamente, apresentamos a ferramenta de anotação automática, o processo de análise morfossintática automática efetuada pelo anotador, o trabalho de revisão manual da etiquetagem automática e as sugestões de melhorias para tratar especificamente de aspectos da oralidade. A partir dos erros do etiquetador, buscamos depreender certos padrões de anotação para superar limitações de desempenho apresentadas pelo programa, propondo algumas sugestões de implementações para que o Aelius etiquete de maneira ainda mais satisfatória um corpus de língua falada. Tratamos especialmente dos casos de interjeições, aféreses, onomatopeias e marcadores conversacionais.PALAVRAS-CHAVE: Etiquetagem Automática. Etiquetagem Morfossintática. Linguística de Corpus.ABSTRACT:In this paper, we present the results of our work with automatic morphological annotation of excerpts from a corpus of spoken language – belonging to the VARSUL project – using the free morphosyntatic tagger Aelius. We present 20 texts containing 154,530 words, annotated automatically and corrected manually. This paper presents the tagger Aelius and our work of manual review of the texts, as well as our suggestions for improvements of the tool, concerning aspects of oral texts. We verify the performance of morphosyntactic tagging a spoken language corpus, an unprecedented challenge for the tagger. Based on the errors of the tagger, we try to infer certain patterns of annotation to overcome limitations presented by the program, and we propose suggestions for implementations in order to allow Aelius to tag spoken language corpora in a more effective way, specially treating cases such as interjections, apheresis, onomatopeia and conversational markers.KEYWORDS: Tagger. Morphosyntactic Tagging. Corpus Linguistics.
APA, Harvard, Vancouver, ISO, and other styles
2

Pereira, Daniervelin Renata Marques. "Editorial – V. 7. N. 2." Texto Livre: Linguagem e Tecnologia 7, no. 2 (2014): 1. http://dx.doi.org/10.17851/1983-3652.7.2.1.

Full text
Abstract:
A revista Texto Livre: Linguagem e Tecnologia traz à luz seu número da primavera de 2014 – volume 7, número 2 –, buscando manter sua periodicidade e receber contribuições de autores brasileiros e estrangeiros nas linhas Linguística e Tecnologia, Educação e Tecnologia, Comunicação e Tecnologia e Cadernos do STIS. Destacam-se nesta edição questões de inclusão pelos recursos tecnológicos livres, especialmente tendo em vista os multiletramentos, isto é, a multiplicidade de linguagens e mídias nos textos contemporâneos e a multiculturalidade e diversidade cultural.Elidéa Lúcia Almeida Bernardino, Giselli Mara da Silva, Rosana Passos e Letícia Capelão de Souza, da Universidade Federal de Minas Gerais, abrem esta edição com o artigo “O ensino de libras na UFMG: uma experiência mais que virtual”, em que relatam e discutem a experiência de implantação e construção da proposta pedagógica do curso de Libras na UFMG. Julie Coiro, da University of Rhode Island, compartilha conosco suas reflexões sobre leitura online, descortinando os desafios sobre a compreensão da leitura online pela perspectiva dos novos letramentos. Em “Anotação morfológica automática de corpus de língua falada: desafios ao Aelius”, Gabriel de Ávila Othero e Mônica Rigo Ayres, da Universidade Federal do Rio Grande do Sul, apresentam a ferramenta de anotação automática, o processo de análise morfossintática automática efetuada pelo anotador, o trabalho de revisão manual da etiquetagem automática e as sugestões de melhorias para tratar especificamente de aspectos da oralidade. Benedito Fernando Pereira, da Universidade do Vale do Sapucaí, publica o artigo “'Vem pra rua': o político e a política em rede”, em que faz uma análise discursiva dos enunciados “vem pra rua” e “somos a rede social”, que estiveram presentes em faixas e cartazes nos protestos de rua no Brasil em 2013.Elaine Teixeira da Silva, da Universidade Candido Mendes, demonstra que o Facebook apresenta características da EaD e, portanto, pode ser considerado um instrumento adicional disponível para essa modalidade de ensino no texto “O ensino de língua espanhola mediado pelas novas tecnologias: da sala de aula ao Facebook”. Elizabeth Guzzo de Almeida e Renata de Souza Lima, da Universidade Federal de Minas Gerais, se propõem a apresentar o percurso de elaboração de uma sequência didática criada para fomentar os letramentos digitais de alunos do Ensino Fundamental II nas aulas de espanhol no artigo “Letramentos digitais e uma sequência didática para o ensino de espanhol”. Em “Programar é bom para as crianças? Uma visão crítica sobre o ensino de programação nas escolas”, Wendell Bento Geraldes, do Instituto Federal de Goiás, apresenta reflexões sobre o ensino de programação nas escolas e os impactos positivo e negativo dessa prática nos dias atuais. Diego Agustín Moreiras, da Universidad Nacional de Córdoba, em língua espanhola, contribui com o artigo “Fotografía en investigación educativa. Experiencias y discusiones en torno a una estrategia metodológica”, em que discute os usos que diferentes projetos fazem da fotografia como parte de suas construções metodológicas. Em “A educação de Surdos e a Robótica Pedagógica Livre”, Danilo Rodrigues César, da Universidade Federal de Uberlândia, e Rafaela Santos de Souza, da Secretaria Municipal de Educação e Cultura (SMEC) – Salvador/BA, propõem uma ação educativa baseada em kits didáticos para robótica, desenvolvidos com materiais de baixo custo e/ou sucatas tecnológicas-eletroeletrônicas.Jefferson Cabral Azevedo, da Universidade Estadual Norte Fluminense, Giovane do Nascimento e Carlos Henrique Medeiros de Souza, da Universidade Estadual do Norte Fluminense Darcy Ribeiro, no artigo “Ciberdependência: o papel das emoções na dependência de tecnologias digitais”, abordam a dependência de tecnologias digitais e as influências dos mecanismos motivacionais e emocionais sobre a aprendizagem de comportamentos compulsivos. Vanda Maria Sousa, da Universidade Lusíada de Lisboa, em “Big Brother is watching you! Ser ou não ser online... Ou a tela como a nossa morada tecnológica”, nos instiga com a seguinte questão: de que forma as telas se interpõem entre o sujeito e a realidade, no contexto das Novas Tecnologias da Informação e da Comunicação, em particular no caso das telas da televisão (no formato do Reality Show) e das telas de computador (na profusão das Redes Sociais)?Fechando esta edição, Margareth de Souza Freitas Thomopoulos, da Universidade Tecnológica Federal do Paraná, publica o artigo “Reflexões sobre o papel da escrita como ferramenta diagnóstica e reintegrativa de sujeitos com problemas cognitivos e a formação linguística dos profissionais da área: para uma legítima inclusão”, discutindo o papel da escrita no diagnóstico diferencial de afasias motoras e apraxias, bem como o seu uso como recurso de preservação/resgate da subjetividade de indivíduos com comprometimentos cognitivos diversos.Finalizamos este editorial desejando uma leitura proveitosa a todos os leitores da Texto Livre.Daniervelin Renata Marques Pereira
APA, Harvard, Vancouver, ISO, and other styles
3

Schmidt, Sabrina Damiani, Débora Spanamberg Wink, and Sara Regina Scotta Cabral. "“Corpus Linguístico UFSM”: construção e etiquetagem." Linguagens & Cidadania 20 (December 28, 2018). http://dx.doi.org/10.5902/1516849234934.

Full text
Abstract:
Este trabalho tem como principal objetivo explicar o processo de construção e de organização do “Corpus Linguístico UFSM”. Para tanto, faz-se uso dos estudos de Halliday (1994), Halliday e Matthiessen (1999, 2004, 2014) e seus seguidores para demonstrar a necessidade de um corpus bem estruturado e organizado para uma análise sistêmico-funcional. Além disso, traz-se Miller (2012) para justificar as escolhas dos gêneros que compõem o corpus. Para a metodologia deste trabalho, busca-se suporte nos estudos de Bick (1996) e de Berber Sardinha (2004) sobre Linguística de Corpus para o processo de etiquetagem morfossintática dos textos. Por fim, apresentam-se os resultados obtidos na coleta e na etiquetagem do “Corpus Linguístico UFSM”, além da expectativa de compartilhamento online desse corpus.
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Etiquetagem morfossintática"

1

Kepler, Fábio Natanael. "Modelagem de contextos para aprendizado automático aplicado à análise morfossintática." Universidade de São Paulo, 2010. http://www.teses.usp.br/teses/disponiveis/45/45134/tde-05082010-223515/.

Full text
Abstract:
A etiquetagem morfossintática envolve atribuir às palavras de uma sentença suas classes morfossintáticas de acordo com os contextos em que elas aparecem. Cadeias de Markov de Tamanho Variável (VLMCs, do inglês \"Variable-Length Markov Chains\") oferecem uma forma de modelar contextos maiores que trigramas sem sofrer demais com a esparsidade de dados e a complexidade do espaço de estados. Mesmo assim, duas palavras do português apresentam um alto grau de ambiguidade: \'que\' e \'a\'. O número de erros na etiquetagem dessas palavras corresponde a um quarto do total de erros cometidos por um etiquetador baseado em VLMCs. Além disso, essas palavras parecem apresentar dois diferentes tipos de ambiguidade: um dependendo de contexto não local e outro de contexto direito. Exploramos maneiras de expandir o modelo baseado em VLMCs através do uso de diferentes modelos e métodos, a fim de atacar esses problemas. As abordagens mostraram variado grau de sucesso, com um método em particular (aprendizado guiado) se mostrando capaz de resolver boa parte da ambiguidade de \'a\'. Discutimos razões para isso acontecer. Com relação a \'que\', ao longo desta tese propusemos e testamos diversos métodos de aprendizado de informação contextual para tentar desambiguá-lo. Mostramos como, em todos eles, o nível de ambiguidade de \'que\' permanece praticamente constante.<br>Part-of-speech tagging involves assigning to words in a sentence their part-of-speech class based on the contexts they appear in. Variable-Length Markov Chains (VLMCs) offer a way of modeling contexts longer than trigrams without suffering too much from data sparsity and state space complexity. Even so, two words in Portuguese show a high degree of ambiguity: \'que\' and \'a\'. The number of errors tagging these words corresponds to a quarter of the total errors made by a VLMC-based tagger. Moreover, these words seem to show two different types of ambiguity: one depending on non-local context and one on right context. We searched ways of expanding the VLMC-based model with a number of different models and methods in order to tackle these issues. The approaches showed variable degrees of success, with one particular method (Guided Learning) solving much of the ambiguity of \'a\'. We explore reasons why this happened. Rega rding \'que\', throughout this thesis we propose and test various methods for learning contextual information in order to try to disambiguate it. We show how, in all of them, the level of ambiguity shown by \'que\' remains practically c onstant.
APA, Harvard, Vancouver, ISO, and other styles
2

DOMINGUES, Miriam Lúcia Campos Serra. "Abordagem para o desenvolvimento de um etiquetador de alta acurácia para o Português do Brasil." Universidade Federal do Pará, 2011. http://repositorio.ufpa.br/jspui/handle/2011/2828.

Full text
Abstract:
Submitted by Samira Prince (prince@ufpa.br) on 2012-06-01T13:27:50Z No. of bitstreams: 2 Tese_AbordagemDesenvolvimentoEtiquetador.pdf: 1889587 bytes, checksum: 3c065577821e8f688e91c0a70bb1340e (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)<br>Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-06-01T13:28:30Z (GMT) No. of bitstreams: 2 Tese_AbordagemDesenvolvimentoEtiquetador.pdf: 1889587 bytes, checksum: 3c065577821e8f688e91c0a70bb1340e (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)<br>Made available in DSpace on 2012-06-01T13:28:30Z (GMT). No. of bitstreams: 2 Tese_AbordagemDesenvolvimentoEtiquetador.pdf: 1889587 bytes, checksum: 3c065577821e8f688e91c0a70bb1340e (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Previous issue date: 2011<br>A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.<br>Part-of-speech tagging is a basic task required by many applications of natural language processing, such as parsing and machine translation, and by applications of speech processing, for example, speech synthesis. This task consists of tagging words in a sentence with their grammatical categories. Although these applications require taggers with greater precision, the state of the art taggers still achieved accuracy of 96 to 97%. In this thesis, corpus and software resources are investigated for the development of a tagger with accuracy above of that of the state of the art for the Brazilian Portuguese language. Based on a hybrid solution that combines probabilistic tagging with rule-based tagging, the proposed thesis focuses on an exploratory study on the tagging method, size, quality, tag set, and the textual genre of the corpora available for training and testing, and evaluates the disambiguation of new or out-of-vocabulary words found in texts to be tagged. Four corpora were used in experiments: CETENFolha, Bosque CF 7.4, Mac-Morpho, and Selva Científica. The proposed tagging model was based on the use of the method of transformation-based learning (TBL) to which were added three strategies combined in a architecture that integrates the outputs (tagged texts) of two free tools, Treetagger and -TBL, with the modules that were added to the model. In the tagger model trained with Mac-Morpho corpus of journalistic genre, tagging accuracy rates of 98.05% on Mac-Morpho test set and 98.27% on Bosque CF 7.4 were achieved, both of journalistic genres. The performance of the proposed hybrid model tagger was also evaluated in the texts of Selva Científica Corpus, of the scientific genre. Needs of adjustments in the tagger and in corpora were identified and, as result, accuracy rates of 98.07% in Selva Científica, 98.06% in the text set of Mac-Morpho, and 98.30% in the texts of the Bosque CF 7.4 have been achieved. These results are significant because the accuracy rates achieved are higher than those of the state of the art, thus validating the proposed model to obtain a more reliable part-of-speech tagger.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!