Dissertations / Theses on the topic 'Lingüística de corpus'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Lingüística de corpus.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Garcia, Tania Mikaela. "Lingüística de corpus." Florianópolis, SC, 2002. http://repositorio.ufsc.br/xmlui/handle/123456789/83617.
Full textMade available in DSpace on 2012-10-20T01:42:51Z (GMT). No. of bitstreams: 0Bitstream added on 2014-09-26T01:51:48Z : No. of bitstreams: 1 184731.pdf: 3048506 bytes, checksum: 88898b74285a6ce4e69815aa47c96294 (MD5)
Este trabalho apresenta um estudo realizado com alunos de 8ª série do ensino fundamental de um colégio da rede particular de ensino de Itajaí - SC, que adota a Metodologia de Projetos de Pesquisa, numa concepção sociointeracionista do processo de ensino/aprendizagem. O estudo teve como objetivos: 1) proporcionar aos alunos o contato com a Lingüística de Corpus (LC), uma metodologia de análise lingüística que pode ser aliada à metodologia aplicada no colégio para o ensino/aprendizagem do Português como língua materna; 2) propor um uso mais produtivo do computador em sala de aula, uma vez que é ele a ferramenta de manipulação de corpora usada na LC; e 3) levantar as contribuições da LC para o estudo do uso dos pronomes pessoais TE/LHE, em contraste com uma abordagem tradicionalista de ensino que se fundamenta na Gramática Normativa e no mero repasse de regras desvinculadas do uso autêntico da língua. A pesquisa parte do pressuposto de que, dentre dois grupos de alunos envolvidos no estudo do uso dos pronomes TE/LHE, um com base em corpus, outro num repasse tradicional de conteúdos, o primeiro grupo obteria melhores resultados numa posterior avaliação, o que parece ser verdadeiro, a despeito do pequeno número de dados disponíveis.
Gonzalez, Zeli Miranda Gutierrez. "Lingüística de corpus na análise do internetês." Pontifícia Universidade Católica de São Paulo, 2007. https://tede2.pucsp.br/handle/handle/13928.
Full textThe study presented was motivated by the needs of comprehend the changes in the ortography of the Internet language, such as identify those changes frequency. The main aim of this study was to focus on the usage of a Corpus Linguistics approach for identification of frequent words most used in the studies corpus, such as frequences of changes in the ortography and the lexican gramathical standards of the internet language. There is a great range of studies on the internet language; however, very few of them has demontrated empirically how frequent changes are. Therefore, this study has tried to fill this gap by being able to show empirically the changes. The main theoretical underpinning for the research is provided by Corpus Linguistics, assuming the main notions presented by Biber (1998), Berber Sardinha (2004, 2006), Sinclair (1991,1996). For focusing the use frequency of lexican items it was considered, more specificly, the studies of Berber Sardinha (2000a, 2000b, 2004), Halliday (1991, 1992, 1993). Besides the Corpus Linguistics, the project also mentioned in questions such as: linguisctics diversity, genre, registry and internet language ortography along the perspective of Possenti (2006), Mollica (2007), Thurlow and Brown (2007), Crystal (2001), Othero, (2004). The corpus employed in the study was collected of young people s blogs that use internet for comunication. This corpus contains 135.021 tokes and 15.552 types. For the development of this research and of the analysis of the lexican items it was considered all the 500 most used words in the corpus studies. The frequences were used as base for decription of changes happened in the variant linguistics ortography the internet language. Among the most frequent items in the corpus was selected the td item with the sense of all, every, everything ( tudo, todo, toda, todas e todos in portuguese), with the objective of verify the standards lexican-gramathical, contributed for the respective senses. To sum up, this study hopes it has contributed to the study of the internet language, since there are few studies that have demosntrated empirically how these changes occur. This work also presentes the research limitations and its possible applications in the future
O trabalho que ora se apresenta foi motivado pela necessidade de compreender as modificações na grafia do internetês, bem como identificar a freqüência dessas modificações. Esse trabalho teve como objetivo principal utilizar uma abordagem baseada em Lingüística de Corpus na identificação das palavras mais freqüentes do internetês, das freqüências de modificações na grafia e os padrões léxico gramaticais. Há vários trabalhos que lidam com a questão do internetês; entretanto, nenhum deles demonstrou empiricamente quão freqüente as modificações ocorrem. Sendo assim, esse trabalho buscou preencher essa lacuna, sendo, portanto, capaz de demonstrar empiricamente a extensão dessas modificações. Para tanto, encontrou suporte teórico na Lingüística de Corpus, adotando as principais noções apresentadas por Biber (1998), Berber Sardinha (2004, 2006), Sinclair (1991,1996). Por enfocar as freqüências de uso de itens lexicais consideraram-se, mais especificamente, os trabalhos de Berber Sardinha (2000a, 2000b, 2004), Halliday (1991, 1992, 1993). Além da Lingüística de Corpus, o projeto também tocou em questões como: variedades lingüísticas, gênero, registro e grafia internáutica sob a perspectiva de Possenti (2006), Mollica (2007), Thurlow and Brown (2007), Crystal (2001), Othero (2004). O corpus empregado na pesquisa foi coletado em blogs de jovens que utilizam a internet para comunicação. O corpus contém 135.021palavras e 15.552 formas. Para as análises dos itens lexicais consideraram-se as 500 palavras mais freqüentes do corpus de estudo. As freqüências detectadas serviram como base para a descrição das modificações ocorridas na grafia da variante lingüística o internetês. Entre os itens mais freqüentes do corpus, selecionou-se o item td com sentido de tudo, toda, todo, todos, todas, com a finalidade de verificar se os padrões léxicogramaticais contribuíam para os respectivos sentidos. Por conseguinte, a pesquisa pretende ter contribuído para o estudo do internetês, uma vez que há poucos trabalhos que demonstrem, de maneira empírica, essas modificações. O trabalho ainda apresenta as limitações da pesquisa e aponta sugestões para futuros estudos
López, Garcia Verònica. "Lingüística de corpus aplicada a la didáctica de la traducción audiovisual." Doctoral thesis, Universitat Autònoma de Barcelona, 2018. http://hdl.handle.net/10803/665316.
Full textWe live in the era of instant news, which is also the era of instant entertainment and leisure activities. This means that translation agencies and recording studios have to translate and dub (or subtitle) series and documentaries in record time. In order to beat deadlines, a single series is often shared out among several translators, leading to multiple problems of coherence. Furthermore, some series, for example some sitcoms, frequently include recurring expressions that become popular in everyday speech, or idiolect markers used by scriptwriters to portray the personality of some of the characters. These expressions, are often so significant that they should also be recurring in the translated versions of these series. This thesis presents a script analysis method based on corpus linguistics that detects these recurring expressions and idiolect markers semi-automatically in the scripts of series and documentaries. Once they have been identified, a translation can be agreed upon before the series is divided up among the team of translators. The series Seinfeld and Little Britain have been used to illustrate the method. Having successfully created and applied this corpus-based method in a professional context, the author designed the application of the method to teaching translation through a task-based teaching unit. The thesis presents this and two pilot tests carried out with students from the undergraduate degree in Translation and Interpreting at the Universitat Autònoma de Barcelona. The thesis also describes the changes introduced to the original teaching unit after the pilot tests, the results of the questionnaires used to collect the students’ own self-assessment as well as their assessment of the teaching unit (content and organisation). The main learning objectives of this unit are: - To understand the importance of pre-translation analysis - To know and use advanced applications of MS Word (macros, operations with Regular Expressions, etc.) - To analyze corpus using a corpus manager (AntConc) One of the corpus used by the students in the teaching unit, the script of Casablanca, illustrates the versatility of the method. The students realise that by using the method, some of the most notorious translation errors in this famous film could have been avoided.
Alambert, Eliane Gurjão Silveira. "Uma tradução premiada sob a perspectiva da lingüística de corpus." Pontifícia Universidade Católica de São Paulo, 2008. https://tede2.pucsp.br/handle/handle/14004.
Full textConselho Nacional de Desenvolvimento Científico e Tecnológico
This study aimed at discover, systematically, features in an awarded translation that could show the translator expertise. Thus, we used the winner of the União Latina in 2006, DNA- O segredo da Vida, translated by Carlos Afonso Malferrari from the originally English written book DNA- The secret of life of James D. Watson. Original and translation were scanned, producing two subcorpora that were aligned in a parallel corpus. The subcorpus containing the translated text was compared with a Portuguese general corpus in terms of vocabulary size, and the results showed that this feature is much alike for both corpora. Based on the fact that a word in English that has a cognate in Portuguese can influence the translation choices, we established two categories, one that presents a direct translation for Portuguese and other that doesn t present a direct translation. A sample with 40 words, 20 of each category, was taken from the parallel corpus to check the translations used for each one. We found that the translator use a number of words in Portuguese for each one in English and that the origin of the word is indifferent to the expert translator, so that it doesn t matter which category the word in English is fit in, for he uses a very similar number of words in Portuguese for each one in English despite its nature. Thus, the results show that the expert translator is committed to the context and is not attached to fixed formulas or predetermined solutions
Este estudo teve o objetivo encontrar, de modo sistemático, características de uma tradução premiada que revelassem a expertise do tradutor. Para tanto, foi selecionada a tradução que recebeu o prêmio União Latina de 2006, DNA- O segredo da Vida, traduzida por Carlos Afonso Malferrari a partir do original em inglês DNA- The secret of life de James D. Watson. O original e a tradução foram digitalizados, dando origem a dois subcorpora que foram alinhados para formar um corpus paralelo. O corpus com o texto traduzido foi comparado com uma amostra do Banco de Português em termos de tamanho de vocabulário, mostrando que a tradução tem tamanho de vocabulário muito próximo à amostra. Baseados no fato de que uma palavra em inglês cognata de outra em português pode exercer influência na escolha da tradução, determinamos duas categorias de palavras a serem investigadas, as que apresentam uma tradução imediata para o português e as que não apresentam tradução imediata para o português. Do corpus paralelo foi extraída uma amostra com 40 palavras, 20 de cada categoria, para o levantamento das traduções. Descobrimos que o tradutor usa traduções variadas para cada palavra do original e que a natureza da palavra na língua inglesa é indiferente ao tradutor experiente, não importando a sua semelhança com o português, pois ele atribui um número de escolhas uniforme entre ambas as categorias. Assim, os resultados mostram que o tradutor experiente tem compromisso com o contexto, não se prendendo a fórmulas ou soluções prédeterminadas
Martins, Lilian de Mello. "Identificação e tradução de metáforas lingüísticas e conceptuais em abstracts da esfera acadêmica: uma análise baseada em lingüística de corpus." Pontifícia Universidade Católica de São Paulo, 2008. https://tede2.pucsp.br/handle/handle/13971.
Full textCorpus Linguistics has recently begun to make inroads into two major fields of linguistic inquiry: metaphor (Deignan, 2005) and translation (Baker, 1993; 1995; 1996; 1998;1999). Metaphor is a central figure of language and thought (Lakoff & Johnson, 1980) which shapes our conceptualization of the world. On the other hand, translators have increasingly utilized the tools made available by Corpus Linguistics to unveil the actual threads researchers follow in order to make translations from one language to another. In such context, the study hereby detailed aims at focusing metaphors as cognitive phenomena. More specifically, the research aims to identify the linguistic and conceptual metaphors in a corpus of academic sphere and subsequently focus the study of metaphor translations under a cognitive approach. For this purpose, methodology started by collecting a parallel corpus of bilingual abstracts of thesis and dissertations in Applied Linguistics, firstly written in Portuguese and then translated into English. The corresponding analysis was based on corpus-driven procedures whereby the evidences gathered have led to questions to be investigated. The study utilized the LC tools (Metaphor Identification Program, Concord and Parallel Concordander) in order to present a safer and wider data analysis. Due to language metaphor richness, the metaphor identification program was used to point out the most probable metaphors in the corpus. Later on, in order to determine the metaphors effectively used and translated, both corpora originals and translations were automatically aligned and submitted to the parallel concordancer for comparison purposes. The results point to a significantly high number of conceptual correlations between metaphors in the original and translated abstracts; nevertheless, in some cases metaphors were missing or mistranslated. If, as Lakoff e Johnson states, metaphors structure the way we understand the world, then these metaphorical shifts may influence how abstracts are understood in both languages
Recentemente, a Lingüística de Corpus começou a fazer incursões em duas grandes áreas da lingüística: metáfora (Deignan, 2005) e tradução (Baker, 1993; 1995; 1996; 1998; 1999). A metáfora é uma figura central de linguagem e do pensamento (Lakoff e Johnson, 1980), que modela a nossa maneira de conceptualizar o mundo. Por outro lado, a tradução é um campo que vem utilizando cada vez mais as ferramentas da Lingüística de Corpus para desvendar de que forma os pesquisadores realizam traduções de uma língua para outra. Inserida nesse contexto, a pesquisa aqui descrita tem como objetivo frisar a metáfora como um fenômeno cognitivo. Mais especificamente, a pesquisa tem por finalidade identificar as metáforas lingüísticas e conceptuais num corpus de esfera acadêmica e, posteriormente, enfocar a abordagem cognitiva nas traduções das metáforas. Para tanto, a metodologia consistiu na coleta de um corpus paralelo composto de resumos de teses e dissertações em Lingüística Aplicada e Estudos da Linguagem da PUC-SP, escritos originalmente em Língua Portuguesa, e suas respectivas traduções para a Língua Inglesa. A análise baseou-se na metodologia orientada pelos dados onde as evidências extraídas do corpus conduzem às questões a serem investigadas. Nesse quadro, o presente estudo fez uso das ferramentas computacionais (Identificador de Metáforas, Concord e o Concordanciador Paralelo) disponibilizadas pela Lingüística de Corpus, de forma a produzir uma análise de dados mais ampla e segura. Devido à vasta riqueza de metáforas na língua, utilizamos o programa Identificador de Metáforas, cuja função principal é a de apontar as palavras com maior potencialidade metafórica dentro de um corpus. Posteriormente, a fim de observar como as metáforas são realmente utilizadas e traduzidas, os dois corpora originais e traduções foram automaticamente alinhados e submetidos ao Concordanciador Paralelo, para fins de comparação. Os resultados apontam para uma grande correspondência conceptual entre as metáforas nos resumos originais e suas traduções; no entanto, ocorreram casos em que as metáforas estavam ausentes ou mal traduzidas. Se, como Lakoff e Johnson argumentam, as metáforas estruturam o modo pelo qual compreendemos o mundo, então essas variações metafóricas podem influenciar a forma como os resumos são entendidos nas duas línguas
Matamala, Ripoll Anna. "Les interjeccions en un corpus audiovisual. Descripció i representació lexicogràfica." Doctoral thesis, Universitat Pompeu Fabra, 2004. http://hdl.handle.net/10803/7498.
Full text"Les interjeccions en un corpus audiovisual: descripció i representació lexicogràfica", PhD studies interjections in an audiovisual corpus of sitcoms, both original and dubbed from English into Catalan. Interjections are described from different perspectives and, after analysing their representation in dictionaries, a bilingual electronic lexicographical tool is proposed.
Martínez, Rodríguez Elena Cristina. "Corpus of the Lycian and Hieroglyphic Luwian Kinship Terms." Doctoral thesis, Universitat de Barcelona, 2020. http://hdl.handle.net/10803/673408.
Full textLa present tesi doctoral té per objectiu oferir un corpus del lèxic de parentiu que es troba atestat a les fonts epigràfiques del lici i del luvi jeroglífic, acompanyat d’un comentari filològic que contempla els aspectes semàntics, morfològics i epigràfics de cada terme. El lici i el luvi jeroglífic són dues llengües anatòliques de la família indoeuroepa i, concretament, del grup dialectal lúvic, les característiques de les quals les converteixen en un material idoni per dur a terme un estudi comparatiu. El lici es troba majoritàriament atestat, en un alfabet derivat del grec, en epitafis funeraris i en algunes inscripcions dinàstiques dels segles V i IV a.C., a la regió sud-oest d’Anatòlia. Per la seva banda el luvi jeroglífic apareix documentat, en una escriptura jeroglífica pròpia, entre els segles XIV i VII a.C. en una àmplia extensió geogràfica que comprèn des del centre i l’oest d’Anatòlia fins el nord de Síria. El seu material es pot dividir en dues fases, les inscripcions d’època hittita, fonamentalment reials, i les inscripcions atestades després de l’anorreament dels grans imperis del mediterrani oriental al Bronze final, que comprèn les gestes, epitafis o dedicatòries de reis i governadors locals. Tant per la seva identitat dialectal, com pel gènere literari que comparteixen les composicions, presentar conjuntament el lèxic d’aquestes dues llengües esdevé idoni per afrontar la seva condició de llengües fragmentàries, especialment en el cas del lici. Així doncs, el present estudi es basa en una compilació exhaustiva i actualitzada del material textual d’aquestes dues llengües, i empra el mètode comparatiu de la lingüística històrica, així com l’anàlisi combinatòria de les dades lingüístiques i de realia, per tal d’obtenir una valoració completa del significat de cada terme. Aquesta metodologia permet, a part de la pròpia descripció lingüística del mot, aportar informació útil pel que fa a aspectes genealògics dels governadors de l’Edat del Ferro de la regió siro-anatòlica i, en relació al lici, comprendre els costums funeraris que es deriven de la distribució dels membres familiars en l’espai de la tomba, la qual cosa condueix a extreure conclusions de caire social vinculades a l’estructura familiar lícia. El corpus de les dues llengües es complementa amb un capítol etimològic final, el qual permet situar la naturalesa lingüística dels termes lúvics de parentiu en relació a la resta de llengües de la família indoeuropea.
Araujo, Vera Maria Araujo Pigozzi de. "Documentação, terminologia e lingüística : uma interface produtiva." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2006. http://hdl.handle.net/10183/7757.
Full textThe main objective of this study is to propose a methodology by which the implementation of a tool in the field of Documentation can be optimized. It deals with a terminological database built on the terminology used by the specialist in his area. Its is backed by the underlying assumptions of the Theory of Enunciation, of the Communicative Theory of Terminology and of the Socioterminology. It is believed that, in this theoretical framework, it is possible to ensure effective communication between the Information Retrieval Systems and users, being the librarian the mediator of communicative process originated in the author of the indexed text. The research draws from resources of Terminography and Corpus Linguistics in order to operationalize the process of collecting, managing and storing a huge amount of information of a given knowledge field.
González-Cruz, María-Isabel. "Hispanismos y canarismos en un corpus de textos ingleses sobre Canarias." Pontificia Universidad Católica del Perú, 2013. http://repositorio.pucp.edu.pe/index/handle/123456789/103400.
Full textH, Kauffmann Carlos. "O corpus do jornal: variação lingüística, gêneros e dimensões da imprensa diária escrita." Pontifícia Universidade Católica de São Paulo, 2005. https://tede2.pucsp.br/handle/handle/13501.
Full textnenhum
O objetivo desta pesquisa é identificar empiricamente semelhanças e diferenças de natureza lingüística nos textos e entre os gêneros de um jornal de expressão do Brasil. Para a sua consecução, foram empregados os recursos teóricos-metodológicos proporcionados pela Lingüística de Corpus (BIBER, 1988; SINCLAIR, 1991; KENNEDY, 1998; BERBER SARDINHA, 2004a). Coletou-se uma amostra que representa a língua portuguesa do Brasil tal como é utilizada contemporaneamente na imprensa diária escrita de prestígio nacional. Ela se compõe de uma semana construída com sete edições aleatoriamente sorteadas, entre as publicadas em 2003 pela "Folha de S.Paulo", totalizando um corpus de estudo de 1.431 textos (493.780 palavras). O corpus jornalístico foi etiquetado automaticamente com o etiquetador morfossintático VISL para a língua portuguesa (BICK, 2005), de alta precisão. A metodologia escolhida para estudar o corpus foi a Análise Multidimensional (BIBER, 1988; LEE, 2000). Seu procedimento estatístico chave, a Análise Fatorial, busca encontrar grupos co-ocorrentes de características e categorias lingüísticas (ou "variáveis"). Das 19 variáveis selecionadas para a extração fatorial inicial, 14 delas compuseram a solução fatorial final. Foram extraídos dois fatores, interpretados em termos de suas funções comunicativas subjacentes - os eixos dimensionais "Narrativo versus Expositivo" e "Argumentativo versus Informativo". O trabalho propõe uma tipologia dos gêneros presentes no jornal, baseada em uma revisão da literatura da área de Estudos de Comunicação (MARQUES DE MELO, 1994 e outras fontes). Ela permitiu a classificação do corpus de estudo e a atribuição de escores, com os quais foi possível mapear os gêneros ao longo das dimensões. Essa perspectiva refinou tipologias anteriores, na medida em que ela não é apresentada de forma dicotômica, mas de acordo com as posições que os gêneros ocupam em relação às dimensões identificadas
Fonseca, Luciana Carvalho. "A tradução de binômios nos contratos de \'common law\' à luz da lingüística de corpus." Universidade de São Paulo, 2007. http://www.teses.usp.br/teses/disponiveis/8/8147/tde-06112007-110242/.
Full textThis research aims at studying binomial expressions in common law agreements in the light of Corpus Linguistics in an attempt to provide translators with the necessary linguistic elements that will enable them to render a natural translation, that is, to translate legal language into legal language. Binomial expressions are formed by two words belonging to the same grammatical category and joined by and or or. Some examples are: terms and conditions, any and all, executed and delivered, due and payable, action or proceeding, agreement or obligation. Binomials are an integral part of English legal language and as such have deserved a considerable amount of study. The same, however, does not occur in Brazilian Portuguese legal language. Therefore, when dealing with binomial expressions, studies show that Brazilian translators tend to translate all the elements of a binomial literally. The choice of text type is due to the fact that agreements and contratos are among the most difficult documents to translate and seem to have an incredibly high concentration of binomial expressions. For said reasons, in order to study binomials in English legal language and provide elements for translators to arrive at their own translation into Brazilian Portuguese, we have compiled and explored a bilingual comparable corpus consisting of authentic agreements and contratos, totalling, approximately, 1 million words - 705,744 in English and 289,984 in Brazilian Portuguese - made up of 5 samples of 28 different kinds of contratos and agreements, a total of 140 documents in each language. Exploring such a corpus greatly depended on the principles and tools of Corpus Linguistics. To tag the corpus we used UCREL\'s CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System) and to explore the corpus we used Mike Scott\'s WordSmith Tools.
Martins, Elisangela Fernandes [UNESP]. "Uma análise da tradução de marcadores culturais em Sergeant Getulio e The Lizard's smile, à luz da linguística de corpus." Universidade Estadual Paulista (UNESP), 2009. http://hdl.handle.net/11449/93903.
Full textNo presente trabalho, examinamos a tradução de marcadores culturais (MCs) presentes em duas obras do escritor João Ubaldo Ribeiro: Sargento Getúlio, traduzida pelo próprio autor como Sergeant Getulio; e a outra, O sorriso do lagarto, traduzida por Clifford Landers com o título de The Lizard’s Smile. Foram analisadas, nos respectivos textos de chegada, as escolhas do autotradutor e do tradutor profissional ao lidarem com diferenças culturais relacionadas aos MCs, com o objetivo de verificar aproximações e distanciamentos entre os dois pares de obras. Investigamos, também, aspectos referentes à tendência de explicitação e simplificação encontrados nos respectivos textos traduzidos. Para tanto, apoiamo-nos no arcabouço teórico-metodológico dos Estudos da Tradução Baseados em Corpus (Baker, 1993, 1996, 2000, 2004), na Linguística de Corpus (Berber Sardinha, 2004), na abordagem interdisciplinar proposta por Camargo (2005, 2007), nos trabalhos sobre domínios culturais de Nida (1945) e de Aubert (1981, 2006), e nos estudos sobre modalidades tradutórias de Aubert (1984, 1998). Para a extração dos vocábulos, contamos com o auxílio das ferramentas de busca disponibilizados pelo programa WordSmith Tools, versão 4.0, que possibilitaram uma análise mais dinâmica e abrangente dos dados. Os resultados obtidos revelam que Ubaldo Ribeiro está mais voltado para o texto de partida buscando uma maior aproximação entre o leitor de língua inglesa e a mensagem do original. Já Landers direcionase mais para o texto alvo valendo-se de um número maior de recursos que podem ser identificados como características de simplificação a fim de tornar mais fácil a leitura do texto traduzido.
In this study, we investigated the translation of cultural markers present in two works written by JoãoUbaldo Ribeiro: Sargento Getúlio, translated by the self-translator as Sergeant Getulio; and the other, O sorriso do lagarto, by Clifford Landers as The Lizard’s Smile. The choices of the self-translator and the professional translator were analysed, in the respective target texts, concerning cultural differences related to cultural markers in order to observe similarities and diferences in both pairs of texts. We also investigated features of explicitation and simplification found in the respective translated texts. The theoretical approach is based on Corpus-Based Translation Studies (Baker, 1993, 1996, 2000, 2004); Corpus Linguistics (Berber Sardinha, 2004), Camargo’s interdisciplinary proposal (2005, 2007), studies on cultural domains (Nida, 1945; Aubert, 1981, 2006), and on translation modalities (Aubert, 1984, 1998). For word extraction, we used the tools provided by the WordSmith Tools program, version 4.0, which enable us to analyse data in a broader and more dynamic way. The results obtained suggest that João Ubaldo Ribeiro’s output shows patterns more likely to be consciously reproduced on the basis of the source text. On the other hand, Landers seems to be closer to the normal patterning of translated English, in an attempt to make the translated text easier for the target reader. Keywords: Corpus Based Translation Studies, Corpus Linguistics, Sergeant Getulio, The Lizard’s Smile, Cultural marker
Pujol, Dahme Ana Mª. "El dominio de la escritura en el género de investigación: de la redacción guiada a la publicación reconocida." Doctoral thesis, Universitat de Barcelona, 2016. http://hdl.handle.net/10803/393887.
Full textLiteracy is inextricably connected with the practise of any academic discipline. The skill to properly use the linguistic register and rhetorical conventions of the research genre is important to achieve academic success and professional development in researcher careers. This is why, when students join a research community they have to become proficient not only in the lexical-grammatical characteristics of academic language, but also in the specific discursive conventions of each disciplinary community. The present dissertation has two general aims. Firstly, the creation of a corpus of academic research projects written in Catalan, from Baccalaureate and University Master Degrees, in the fields of biology and history. This corpus is called TARBUC (Treballs Acadèmics de Recerca de Batxillerat i Universitat en Català)1 and has been digitised so as to be available to the research community. Secondly, by using this corpus, I have attempted to characterise the development of academic writing at different stages throughout students’ school lifetime. For this reason I am presenting two studies. In the first of these, I transversally compare a corpus of research projects written in Catalan from Baccalaureate and end of University Master in the fields of biology and history. In study 2, I longitudinally compare end of University Master research projects, again in Catalan, with biology articles published in English. Specifically, I characterise the register and meta-discourse. When analysing the register I use the following lexical-grammatical features: (i) lexical diversity, (ii) lexical density and (iii) syntactic complexity. Regarding meta-discourse, I examine the meta-discursive interactional function through linguistic markers, which indicate, on the one hand, the authorial voice as self-representation in writing, that is, stance, and, on the other, those markers used by the writer to involve the reader, that is, engagement. The results of these implications are discussed in linguistic, cognitive and socio-cultural terms and suggest that ability to adequately display linguistic register and rhetorical conventions in accordance with a specific disciplinary community is in itself a lengthy process. 1 Baccalaureate and University Academic Research Reports written in Catalan.
Gonçalves, Marcos Antônio. "As formações x-inho nas modalidades oral e escrita: um estudo contrastivo baseado na lingüística de corpus." Universidade do Estado do Rio de Janeiro, 2006. http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=59.
Full textThe items ending in -inho are described in the majority of grammars of Portuguese as conveying two notions, namely affect and dimension. However, the same grammars do not seem to include either the extralinguistic or contextual factors in which speakers are inserted when they opt for a word ending in -inho. The aim of the present work thus is to investigate the productivity of such items in two electronic corpora: one of an oral nature which is further subdivided into two sub-corpora containing narratives and descriptions and a second one compiled exclusively from the various sections of a widely read quality newspaper. The dissertation quantifies the various instances of items ending in inho in each of the corpora. Next, each of these occurrences is analysed and classified to check which notion (dimentio,positive affect, negative affect, intensification) they convey. Last the results of both frequency and dispension counts are contrasted for each of the corpora. The methodology of our analyses is centered on the area known as Corpus Linguistics, which provides a basis for the data to be compiled and interpreted.
Freitas, Ana Luiza Pires de. "Proficiência escrita em inglês especializado : estudo de corpus de abstracts em Medicina, Nutrição e Farmácia." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2016. http://hdl.handle.net/10183/148955.
Full textThis research explores the development of written proficiency in English regarding the production of abstracts in the filed of Health Sciences. As such, it aims at contributing to the advances in the studies of English for Academic Purposes by fostering language teachers’ development, and by providing support to the creation of instructional materials. Based on Corpus Linguistics, Linguistics for Specialized Languages and English for Academic Purposes, the investigation put together, described and analyzed a corpus of 180,170 words, comprised by abstracts in Medicine, Nutrition and Pharmacy. The analytical study units are lexical bundles, recurrent strings of words used in texts. For the bundles extraction and identification, an extent criterion of 4 graphic words and a frequency and minimum distribution of 5 occurrences, in at least 5 different texts in each of the two parts of the corpus, were established. 96 lexical bundles were extracted from the international subcorpus, which adds up to 90,098 words, whilst 88 recurrent word sequences were obtained from the Brazilian subcorpus, which amounts to 90,072 words. Regarding the metrics of lexical frequency and variability, the two data segments uncovered distinctions in the ways of building up a scientific narrative. A larger repetition of word associations and a higher use of lexical bundles to express purpose and to highlight the achievement of the academic endeavor were noticed in the Brazilian subcorpus. The international subcorpus, on the other hand, features more diverse recurrent strings of words, a concise prose and the use of extended collocations to highlight the scientific enterprise in itself. Although these findings are specific to the corpus studied, they bring out the usefulness of language educators’ and program designers’ awareness of the peculiarities of the different abstract production contexts, so that pedagogical practice can be attuned to learners’ needs. Suggestions for the application of the findings in teaching tasks are provided in the concluding part of the investigation.
Teixeira, Elisa Duarte. "A lingüística de corpus a serviço do tradutor: proposta de um dicionário de culinária voltado para a produção textual." Universidade de São Paulo, 2008. http://www.teses.usp.br/teses/disponiveis/8/8147/tde-16022009-141747/.
Full textDictionaries have always been and still are one of the main tools for the translator s task. Nevertheless, terminography does not seem to have systematically benefited, at least in Brazil, from the close relation between technical dictionaries and this increasingly significant and particular target audience: technical translators. In the field of Culinary, for instance, which has witnessed a growing demand for translations in Brazil, much as the dictionaries available for the English-Portuguese language pair may contribute to the understanding of the source text, they still do not provide any information on how the terms are actually used in real texts. In other words, they do not help the translator in a crucial step of the translation activity: text production in the target language. The thesis advanced here is that a dictionary which seeks to meet the needs of a translator s text production should focus on the aspects which characterize technical texts from the point of view of translation itself, that is, it should describe and propose translation equivalents or suggestions for the Specialized Translation Units (STUs) occurring in these texts, which the translator in the area often comes across in her/his practice, whether they are terminological or not. Corpus Linguistics (CL), an empirical approach which regards language as a probabilistic system, has devoted itself to the identification of recurring lexico-grammatical patterns in language by observing authentic texts organized as electronic corpora. It is, therefore, the field of studies we deem capable of providing the most adequate theoretical and methodological support to extract the STUs from real texts. In order to embrace these units, a proposal of an online bidirectional English-Portuguese dictionary is presented, which is aimed at the technical Culinary translator. The steps followed in the development of this study were organized in six chapters. The first deals with the theoretical and practical aspects of technical translation and discusses the role of terminology in translation practice. The second examines the specificities of the Culinary translator s job in Brazil and characterizes the culinary recipe , the focus of this study, in terms of text genre and typology. In the third chapter, the theoretical and methodological foundations of CL are presented, as well as the criteria used in the compilation of the corpus to be used for the identification of the STUs. Chapter IV describes the exploration of this corpus: first, we present the study in which a manual search of lexico-grammatical patterns using the WordSmith Tools program is carried out; next, a methodology for semi-automatic extraction of STUs in the corpus is described. Chapter V presents our proposal for a bidirectional online Culinary Dictionary for Translators, describing its macro- and microstructure. Chapter VI contains the final considerations. The results obtained in this study bear witness to the fact that CL, if used not only as a methodology, but as a theoretical approach in the investigation of specialized corpora, enables the production of more useful and trustworthy dictionaries for the translator, for it takes into account any association patterns between words with a probability of occurrence in representative texts in the field a fact which strongly supports the inclusion of these patterns in a dictionary aimed at the translator-producer-of-texts
Campos, Daniela Penharvel de Alvarenga. "Confrontando o livro didático de inglês: os verbos try e like numa perspectiva da Lingüística de Corpus." Pontifícia Universidade Católica de São Paulo, 2006. https://tede2.pucsp.br/handle/handle/13879.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior
The main aim of this study was to investigate the phraseology of the verbs try and like in English and confront the information gathered through the analysis of the data with the usage suggested by the course book Inside Out- Upper-Intermediate, adopted by the school I work for. In order to do so, the main theoretical support was provided by Corpus Linguistics, which is the area concerned with the collection and analysis of criteriously selected corpora, by means of computers. Although there are a number of studies based on the use of corpora in teaching, there is not any study concerned with describing what has been described in this one, mainly in respect of the use of the data gathered to the teaching of a foreign language. Therefore, this study aims at closing this gap in literature. Three questions were investigated in order to study the phraseology of the verbs try and like, in order to reach the objective of the study. The corpus used in the study was the BNC (British National Corpus), which is a corpus of native speakers of British English, of different linguistic varieties, that has more than 100 million words. The corpus analysis led us to the observation of differences between the usage suggested by the course book and the usage made by native speakers of English, which was the main aim of this study. The study presented may have contributed to the existing corpus-based research, especially in the area of Corpus Linguistics and the Teaching of English as Foreign Language, as it shows how the use of real data can be an important and essential tool to the teaching of English as a foreign language
O trabalho teve como objetivo principal investigar a fraseologia dos verbos try e like em inglês e confrontar as informações obtidas por meio da análise dos dados com a prescrição de uso sugerida pelo livro didático Inside Out- Upper- Intermediate, adotado pela escola em que trabalho. Para tanto, o trabalho utilizou o suporte teórico da Lingüística de Corpus, que é a área que se preocupa com a coleta e exploração de corpora eletrônicos, por meio de computadores, de maneira criteriosa. Apesar de haver muitos trabalhos baseados no uso de corpora para o ensino, não há qualquer pesquisa que busque descrever o que foi descrito neste trabalho, principalmente no tocante ao uso dos dados obtidos para o ensino de língua inglesa. Portanto, esta pesquisa procura preencher esta lacuna. Foram levantadas três perguntas de pesquisa relativas à fraseologia dos verbos try e like, a fim de alcançar o objetivo proposto. O Corpus empregado nesta pesquisa foi o BNC (British National Corpus), um corpus de falantes nativos de inglês britânico, com diversas variedades lingüísticas, que conta com mais de 100 milhões de palavras. A análise do corpus permitiu que fossem observadas diferenças entre o uso prescrito pelo livro didático e o uso feito por falantes nativos de língua inglesa, o que era o objetivo deste trabalho. A pesquisa pretende ter contribuído para a área de Lingüística de Corpus e Ensino ao demonstrar como a utilização de dados reais pode ser uma ferramenta importante e essencial no ensino de língua estrangeira
Williams, Camus Julia T. "Metaphors of cancer in scientific popularisation articles in the English and Spanish press." Doctoral thesis, Universitat Pompeu Fabra, 2014. http://hdl.handle.net/10803/145374.
Full textEsta tesis describe las metáforas del cáncer en un corpus bilingüe inglés-español de 300 artículos de divulgación en la prensa. El objetivo ha sido identificar los distintos dominios fuente relevantes que se emplean en la conceptualización de la enfermedad. Aunque varios trabajos han estudiado las metáforas bélicas utilizadas en el discurso del cáncer, todavía se sabe poco de la forma en la que el cáncer se representa mediante metáforas al público lego y de la variedad de dominios fuente que conceptualizan el dominio meta. Así, además del dominio fuente de la GUERRA, VIOLENCIA Y AGRESIÓN, este estudio se centra en otros sistemas metafóricos empleados para clarificar diversos aspectos como la metástasis, la apoptosis, los tratamientos del cáncer y la investigación oncológica. El análisis textual se ha realizado con la ayuda de un programa informático de análisis de corpus textuales. Las metáforas de ambos subcorpus se han comparado cuantitativa y cualitativamente con el fin de identificar diferencias transculturales en relación a las funciones y a los patrones de las mismas. Aunque el conocimiento sobre el cáncer se divulga a través de expresiones metafóricas similares, se pueden apreciar pequeñas diferencias en relación a la densidad metafórica, la elección de las metáforas y las funciones que estas expresiones desempeñan.
Márquez, Rojas Melva Josefina. "El anglicismo terminológico integral en los textos especializados: pautas para su tratamiento automatizado." Doctoral thesis, Universitat Pompeu Fabra, 2005. http://hdl.handle.net/10803/7496.
Full textFerreira, Elias. "Palavra freqüente, pronúncia diferente: a lingüística de corpus auxiliando o ensino da pronúncia do inglês como língua estrangeira." Pontifícia Universidade Católica de São Paulo, 2006. https://tede2.pucsp.br/handle/handle/13762.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior
Este trabalho tem como objetivo descobrir quais são os vocábulos da língua inglesa que apresentam uma relação atípica entre a ortografia e a pronúncia e que têm freqüência de uso relevante, observada por meio de um corpus. O resultado deste trabalho poderá ter posterior aplicação na formação de professores brasileiros de inglês, orientando a preparação dos mesmos em relação à área de pronúncia de vocábulos a partir da forma escrita, indicando quais palavras necessitam receber maior atenção durante o processo de formação acadêmica, atuando assim como um trabalho de referência
Gonçalves, Lourdes Bernardes. "Dubliners\' sob a lupa da lingüística de corpus: uma contribuição para a análise e a avaliação da tradução literária." Universidade de São Paulo, 2006. http://www.teses.usp.br/teses/disponiveis/8/8147/tde-08112007-154609/.
Full textThis thesis aims at demonstrating the valuable contribution of Corpus Linguistics in the analysis of literary texts and in the evaluation of literary translation. The selected texts are Dubliners (1914), a collection of short stories by James Joyce, and two translations thereof, both entitled Dublinenses, one by Hamilton Trevisan (1964), and the other by José Roberto O Shea (1993). Firstly, an analysis of the original work is carried out and, after that, the evaluation of translations. In order to verify the effective contribution of Corpus Linguistics, an analysis of the original text and its translations was performed, using two different approaches, a non computational as well as a computational one. The data thus obtained were compared and, as a result, it could be established that Corpus Linguistics really represents an approach which makes a significant contribution to the processes of literary text analysis and the evaluation of literary translations. Therefore, a model for the evaluation of literary translations was proposed, bringing together characteristics of the traditional approach and that of Corpus Linguistics. This model was then tested on four short stories from Dubliners.
Luzorio, Camilla Canella Moraes. "Gramaticalização e Preposições Complexas do Português: um estudo baseado em corpus." Universidade do Estado do Rio de Janeiro, 2008. http://www.bdtd.uerj.br/tde_busca/arquivo.php?codArquivo=578.
Full textThe present dissertation introduces a study which applies the theory of Grammaticalization to a digital diachronic corpus, with a view to mapping some of the changes which have taken place in certain structures of Portuguese, the so-called prepositional phrases. The objectives of the research were threefold. First, the study aimed at investigating the complex prepositions em face de, em face a, face a, em vista de, em frente de, em frente a e frente a, in order to understand their syntactic and semantic development and, in turn, to evaluate whether they are undergoing a process of grammaticalization. Secondly, the study sought to examine texts from a variety of historical periods, so as to map a possible trajectory taken by the afore mentioned forms between the 14th and the 20th centuries. Thirdly, the study intended to verify whether the items frente a e face a may be considered reductions of em frente a and em face a, respectively. The theoretical framework for the study has been taken from Grammaticalization, a theory which explains phenomena which affect linguistic items. The process of grammaticalization may consists in one item, lexical or grammatical, becoming more grammatical. The triggering factor in this case is said to be the frequency of use. Corpus Linguistics has provided a methodology for the compilation, extraction and treatment of the textual data in this dissertation. Similarly to Hoffman (2005) the investigation here was based on electronic corpora. The study corpus was the Corpus do Português, which consists of texts in Portuguese, written between the 14th and the 20th century, available at http://www.corpusdoportugues.org/. The study suggests that the complex prepositions analysed have become increasingly grammaticalised, because they have acquired additional abstract meanings. It has also been observed that, in many ways, these abstract meanings coexist as layers. However, there seems to be a tendency for one form to become the preferred way of expressing each of these new meanings
MARÍN, SALGUERO Edson Adir. "Corpus lingüístico de metasememas en textos periodísticos del español actual de la región central de México." Tesis de maestría, Universidad Autónoma del Estado de México, 2012. http://hdl.handle.net/20.500.11799/110495.
Full textVila, Rigat Marta. "Paraphrase Scope and Typology. A Data-Driven Approach from Computational Linguistics / Abast i tipologia de la paràfrasi. Una aproximació empíriica des de la lingüíística computacional." Doctoral thesis, Universitat de Barcelona, 2013. http://hdl.handle.net/10803/117850.
Full textS'entén per paràfrasi la igualtat aproximada de significat entre fragments de text que difereixen en la forma. La paràfrasi és omnipresent en les llengües naturals, on es troba expressada de múltiples maneres. D'una banda, la ubiqüitat de la paràfrasi l'ha convertit en el centre d’interès de moltes tasques específiques dins de la lingüística computacional; de l'altra, la seva complexitat ha fet de la paràfrasi un problema que encara no té una solució definitiva. Dues qüestions bàsiques, lligades a la naturalesa complexa de la paràfrasi, fan el seu tractament computacional particularment difícil: l'absència d'una definició precisa i comunament acceptada i la manca de corpus de paràfrasis de referència. Assumint que el coneixement lingüístic ha de ser a la base de la recerca en lingüística computacional, aquesta tesi pretén avançar en dues línies de treball: en la delimitació i comprensió del que s’entén per paràfrasi, i en la creació i anotació de corpus de paràfrasis que proporcionin dades sobre les quals fonamentar tant la recerca com futurs recursos i aplicacions. Amb l'objectiu d’avaluar empíricament el seu potencial, el coneixement i els recursos creats com a resultat d'aquest treball han estat aplicats a la detecció automàtica de plagi. Aquesta tesi consisteix en un compendi de publicacions i comprèn sis articles principals dividits en tres blocs: (i) abast i tipologia de la paràfrasi, (ii) creació i anotació de corpus de paràfrasis i (iii) la paràfrasi en la detecció automàtica de plagi. En el primer bloc, partint de la base que els límits de la paràfrasi no són fixos, sinó que depenen de l'àrea de treball, la tasca i els objectius, es presenten tres casos límit de la paràfrasi: la pèrdua de contingut, el coneixement pragmàtic i la variació en determinats trets gramaticals. La caracterització de la paràfrasi pren una nova dimensió si l'observem des d'una perspectiva extensional. En aquesta línia, s'ha construït una tipologia general de la paràfrasi lingüísticament fonamentada. La tercera qüestió tractada en aquest bloc és la representació de la paràfrasi, essencial a l'hora de tractar-la formalment. En el segon bloc, es presenta un mètode per a l’adquisició de paràfrasis relacionals a partir de la Wikipedia (Wikipedia-based Relational Paraphrase Acquistion, WRPA). Aquest mètode permet extreure automàticament de la Wikipedia paràfrasis que expressen una relació concreta. Utilitzant aquest mètode, s'ha creat el corpus WRPA, que cobreix diverses relacions i dues llengües (anglès i espanyol). Un subconjunt del corpus WRPA en espanyol i exemples extrets de dos corpus de paràfrasis en anglès s'han anotat amb els tipus de paràfrasis que es proposen en aquesta tesi. Aquesta anotació ha estat validada aplicant les mesures d’acord entre anotadors (Inter-annotator Agreement for Paraphrase-Type Annotation, IAPTA), també desenvolupades en el marc d'aquesta tesi. En el tercer i últim bloc, la tipologia proposada s'ha aplicat a l'àmbit de la detecció automàtica de plagi i s'ha demostrat que els tipus de paràfrasis més complexos i l'alta concentració de mecanismes de paràfrasi fan més difícil la detecció del plagi. També s'ha demostrat que les substitucions lèxiques i l'addició/eliminació de fragments de text són els mecanismes de paràfrasi més utilitzats en el plagi. Així, es demostra el potencial del coneixement parafràstic en la detecció automàtica de plagi i en la recerca en lingüística computacional en general.
Sánchez, Gijón Pilar. "Els documents digitals especialitzats: utilització de la lingüística de corpus com a front de recursos per a la traducció." Doctoral thesis, Universitat Autònoma de Barcelona, 2003. http://hdl.handle.net/10803/5261.
Full textSpalek, Alexandra Anna. "Verb meaning and combinatory semantics: a corpus based study of Spanish change of state verbs." Doctoral thesis, Universitat Pompeu Fabra, 2014. http://hdl.handle.net/10803/145476.
Full textAunque es intuitiva y quizás obvia la idea de que la composición conduce a interacciones semánticas no triviales entre las palabras que afectan al contenido de una predicación, hay todavía pocos trabajos que analicen el modo como los verbos restringen sus argumentos y examinen si sus restricciones son muy amplias o más bien limitadas. Esta tesis parte de la observación de que los verbos tienen unos paradigmas combinatorios muy ricos, para plantear la pregunta acerca del papel que desempeña la combinatoria predicado-argumento tanto en el significado de los verbos como en el proceso de construcción del significado composicional. Se llevan a cabo tres estudios de caso correspondientes a otros tantos verbos de cambio de estado, congelar, romper y cortar, en los que se presenta una rica colección de datos que se discute a la luz del conocimiento que proporcionan los estudios de lingüística teórica. Abordar la cuestión del rico paradigma de combinatoria de los verbos conduce a tomar una posición en el horizonte de las teorías de la predicación, así como también en el de las teorías del léxico. La presente tesis se decanta en este sentido por la teoría de tipos moderna (Modern Type Theory) y un significado léxico subespecificado.
Azeredo, Susana de. "Expressões anunciadoras de paráfrase em manuais acadêmicos de química : um estudo baseado em Corpus." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2007. http://hdl.handle.net/10183/10706.
Full textThis thesis deals with the presence and the use of EAP (Expressões Anunciadoras de Paráfrase, paraphrase introducing expressions) in Chemistry academic manuals. The aim is to provide support to identify factors that contribute to comprehension difficulties of this kind of text, and to measure the role of EAP in such a problem. First, this research describes the frequency and distribution of EAP in a corpus formed by two General Chemistry academic manuals translated into Portuguese (ATKINS, 1998 and MAHAN, 1987). Afterwards, the translation of EAP is discussed by comparing the original text in English to the translated text in Portuguese. This research also compares Chemistry manuals to other textual genres by analyzing the presence of EAP aiming to evaluate how much the presence of EAP characterizes a textual genre. With such an objective, five other corpora are observed. These corpora comprise: 1) a Chemistry manual originally written in Portuguese; 2) academic papers in Chemistry; 3) texts of scientific diffusion in Chemistry; 4) academic papers in Computer Sciences, and 5) general language texts. This study comprises theoretical background of Terminology, Textual Linguistics, Translation, Textual Genre and Corpus Linguistics Studies. The results show the presence of three Portuguese EAP in Chemistry manuals: OU SEJA, ISTO É and EM OUTRAS PALAVRAS. The analysis of the use of EAP showed that they have a polyhedral character which is not exclusive to General Chemistry academic manuals and, in some cases, it is related to textual cohesion and coherence issues. The aim is not to carry out an exhaustive study of Chemistry language and text, but to provide a means of gaining a better understanding of reading comprehension difficulties of a didactical material largely used by academic students of Chemistry.
Morales, Flavia Priscila de Oliveira. "Integrando lingüística de corpus e aprendizagem experiencial: uma proposta de atividade de ensino com conteúdo multimídia veiculado on-line." Pontifícia Universidade Católica de São Paulo, 2008. https://tede2.pucsp.br/handle/handle/14025.
Full textSecretaria da Educação do Estado de São Paulo
The main objective of this research is to propose activities for English classes, by making use of on-line multimedia content and concordances. In order to achieve such purpose, we followed the Corpus Linguistics theoretical and methodological frameworks, and also the teaching and learning theory presented by the Experiential Learning (Kolb,1989; Nunan, 1992; Kohonen, 2002). we see concordances as the main tool to be applied in a teaching corpus (Berber Sardinha, 2004:272), since we comply with the Corpus Linguistics and teaching research basis which were already proposed by several authors (Johns, 1994; Fox, 1998; Sinclair, 2003; Richards, 2001; Tomlinson, 2003). However, we have realized that activities, which are solely focused on concordances, can be seen as out of context, repetitive and uninteresting. Therefore, considering the present availability of on-line resources provided to our society, the use of multimedia content as a motivating factor to teach languages seems to offer a good alternative in order to find viable solutions to such problems. we highlighted one of the main concepts advocated by Corpus Linguistics that considers language as a probabilistic system that presents a certain regularity in the types of association to which the words of a language are submitted to (Berber Sardinha, 2004:39). Following the Experiential Learning Theory, we understand that theoretical concepts will be part of one s reference only when s/he has experienced them in a meaningful way, at an emotional level. The use of multimedia content can also contribute to this conception. Two corpora were used in this investigation: the first is a research corpus comprising speech transcripts from films and real contexts totaling 335,498 tokens; and the second is the reference corpus built from the BNC (British National Corpus) spoken part, with a total of 11,063,472 tokens. Linguistic content was extracted from the research corpus so as to propose the teaching activities presented here. Therefore, the research questions are related to aspects of the typical linguistic features found in the research corpus. we hope that this research will contribute to the pedagogical practice of English teachers who are willing to use corpus in their classes. we also believe that it might fill in a gap found in previous research concerning the use of multimedia content available on-line. we hope that this research will help to integrate the Corpus Linguistics empirical view to the Experiential Learning theory as well
Esta pesquisa tem como objetivo propor uma atividade de ensino de língua inglesa, com conteúdo multimídia veiculado on-line e uso de concordâncias, de acordo com as visões teóricas e metodológicas da Linguística de Corpus e tendo a Aprendizagem Experiencial (Kolb, 1984; Nunan, 1992; Kohonen, 2002) como base teórica de ensino e aprendizagem. Seguindo a tradição da linha de pesquisa de Linguística de Corpus e Ensino, vemos a concordância como o principal instrumento no emprego de corpus no ensino (Berber Sardinha, 2004:272), como já proposto por vários autores (Johns, 1994; Fox, 1998; Sinclair, 2003; Richards, 2001; Tomlinson, 2003). Percebemos, no entanto, que atividades centradas somente em concordâncias como exercício podem parecer descontextualizadas, repetitivas e desinteressantes. Em uma sociedade com acesso cada vez mais viável a conteúdos on-line, o uso de multimídia como pretexto motivador para o ensino de línguas parece, então, oferecer uma boa saída para essa questão. Dentre os conceitos trazidos pela Lingüística de Corpus, remetemos à visão de linguagem como um sistema probabilístico que apresenta uma certa regularidade nos tipos de associação a que se submetem as palavras de uma língua (Berber Sardinha, 2004:39). Da Teoria de Aprendizagem Experiencial, destacamos especialmente a idéia de que conceitos teóricos farão parte das referências de um indivíduo somente quando ele/ela os tiver experienciado de forma significativa, em nível emocional. O uso de conteúdos multimídia no ensino também colabora para essa concepção. Foram empregados dois corpora na pesquisa: o primeiro com transcrições de discursos feitos em filmes e em contextos reais, totalizando 335.498 tokens (palavras), e o segundo composto da parte falada do corpus britânico BNC (BNC spoken), com 11.063.472 tokens como referência. Os conteúdos linguísticos a serem propostos na atividade de ensino foram extraídos do corpus de estudo. Assim sendo, as questões de pesquisa estão relacionadas às características linguísticas típicas do corpus de estudo Esperamos que esta pesquisa possa contribuir para a prática pedagógica de professores de inglês que desejem inserir o uso de corpus na sala de aula, bem como venha a preencher uma lacuna observada nas pesquisas anteriores em relação à utilização de conteúdo multimídia veiculado on-line. Acreditamos, ainda, que este estudo favoreça a integração da visão empírica da Linguística de Corpus à Teoria de Aprendizagem Experiencial
Pasqualini, Bianca Franco. "Corpop : um corpus de referência do português popular escrito do Brasil." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2018. http://hdl.handle.net/10183/177566.
Full textThis thesis proposes a corpus of Brazilian popular Portuguese written, called CorPop, with texts selected based on the average level of literacy of the country 's readers. CorPop's theoretical and methodological bases are interdisciplinary and fall within the scope of Language Studies and related disciplines, such as Corpus Lexicon and Linguistics Studies, Textual Linguistics and Psycholinguistics, and also dialogues with Natural Language Processing studies. Thus, this research is housed in the Lexicography, Terminology and Translation Research Line: Textual Relations of PPG-Letras-UFRGS, and our cut, therefore, tends to highlight the Lexicon. The development of CorPop took place through the compilation of data about the level of literacy of Brazilian readers and the characteristics that could compose a standard of textual simplicity in a corpus of texts suitable for these readers. These data were collected from the surveys of the Indicator of Functional Literacy (INAF) and Reading Portraits in Brazil, as well as a questionnaire with readers. The texts selected for CorPop are (1) texts of the popular journalism of the PorPopular Project (newspaper Diário Gaúcho), massively consumed by the C and D classes, which is the average Brazilian reader; (2) texts and authors most read by the respondents of the last editions of the research Retratos da Leitura no Brasil; (3) collection "É Só o Começo" (adaptation of classics from Brazilian literature to readers with low literacy, adaptation by linguists); (4) texts of the newspaper Boca de Rua, produced by street people, with low schooling and low literacy; and (5) texts of the Diário da Causa Operária, the Brazilian working press produced also by people within the average literacy range of the country. After the collection, preparation and processing of the texts of the corpus, a series of experiments with the crude list of frequencies and the list of frequencies typed in CorPop. The results obtained show promising applications of CorPop in several linguistic tasks, such as text simplification and use as controlled vocabulary for writing definitions in dictionaries. Also, CorPop proves that a small corpus can have the same validity as a corpus of large proportions.
Ribas, Bruguer Marta. "Alineació de textos jurídics paral·lels (català-castellà): alguns problemes." Doctoral thesis, Universitat Pompeu Fabra, 2006. http://hdl.handle.net/10803/7502.
Full textPartint d'un corpus de textos jurisprudencials paral·lels catalans i castellans i utilitzant el programa ALINEA, fem un estudi descriptiu de detall sobre les diferències discursives entre els textos jurisprudencials catalans i castellans per tal de formalitzar el coneixement comparatiu del discurs jurídic (jurisprudencial) català i castellà. Establim una tipologia dels fenòmens lingüístics propis d'aquest discurs que poden generar alineacions insatisfactòries, n'estudiem les causes i fem una proposta de tractament lexicogràfic i d'estratègies complementàries (regles lingüístiques) per millorar els resultats de l'alineació d'aquest tipus de textos.
Recent development in alignment programs of bilingual corpora open horizons in studies about specialized texts. Its use let to contrast and to show discoursive differences between parallel specialized texts in different languages. This constitues a benefit in the treatment of comparative knowledge between one discourse and the other. Nevertheless, the formalization of this knowledge is a complex task and, so, the cases of noise in the results of the programs show it.
Considering a corpus of Catalan and Spanish jurisprudencial parallel texts and using the ALINEA program, we present a descriptive study of detail about the discoursive differences between Catalan and Spanish jurisprudencial texts in order to formalize the comparative knowledge of Catalan and Spanish legal (jurisprundencial) discourse. We set a typology of own linguistic phenomena about this type of discourse which can generate non satisfactory alignments, we study the causes of this and we make a proposal of lexicographic treatment and of supplementary strategies (linguistic rules) in order to improve the results of the alignment of this type of texts.
Lacerda, Glaucia Dutra. "Modelagem lingüística comparada em corpora de desastres naturais : explorando técnicas e métodos." reponame:Repositório Institucional da UFABC, 2012.
Find full textPadilha, João Gabriel Rodrigues Marques. "A polissemia na linguagem do futebol: uma proposta de aproximação entre redes lexicais e frames semânticos." Universidade do Vale do Rio dos Sinos, 2015. http://www.repositorio.jesuita.org.br/handle/UNISINOS/3774.
Full textMade available in DSpace on 2015-06-05T17:30:17Z (GMT). No. of bitstreams: 1 João Gabriel Rodrigues Marques Padilha.pdf: 2330081 bytes, checksum: 9e1d525b6ce245c7b907b482a38050f3 (MD5) Previous issue date: 2015-03-02
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
FAPERGS - Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul
O objetivo deste trabalho é problematizar o tratamento da polissemia em um recurso lexical baseado em frames . Para tal, estabeleceremos um cotejo entre a Semântica de Frames e a visão cognitivista de polissemia, buscando estabelecer uma aproximação entre os frames e as redes lexicais. No intuito de atingir esse objetivo, partiremos de alguns estudos mais conhecidos sobre a polissemia, como Brèal (1992), Ullmann (1964) e Lyons (1977), com vistas a situar o tema no tempo e no espaço. O segundo capítulo teórico deste trabalho apresentará o paradigma conhecido como Linguística Cognitiva, trazendo seus principais compromissos, bem como o contexto histórico em que se insere. Para tal, traremos as contribuições de Evans e Green (2006). Também discorreremos sobre a Semântica de Frames (FILLMORE, 1982), uma teoria circunscrita ao paradigma cognitivista que considera o significado do ponto de vista enciclopédico, sem fazer distinções entre informações linguísticas e informações contextuais no processo de significação. Em seguida, apresentaremos a FrameNet, um recurso lexicográfico online erigido sob os princípios da Semântica de Frames, com vistas a problematizar o tratamento dispensado à polissemia por esse recurso computacional. Ainda no segundo capítulo teórico, apresentaremos a visão cognitivista da polissemia, partindo de Langacker (1987) e Geeraerts (2006), em relação às noções de categoria complexa e flexibilidade, respectivamente, e de Lakoff (1987) e Fauconnier e Turner (2006), que oferecem modelos teóricos que possibilitam o estudo da polissemia, sejam eles as categorias radiais e a mesclagem conceptual. A parte aplicada deste trabalho consiste em empregar as categorias radiais de Lakoff (1987) na descrição dos sentidos polissêmicos do substantivo ataque e do verbo marcar – o uso já consagrado das redes – bem como na descrição dos frames evocados por tais sentidos – aplicação que propomos nesta dissertação. Acreditamos que nossa proposta de integração entre redes e frames é justificada (i) por um princípio da Linguística Cognitiva, segundo o qual o significado é um conceito, assim como, da mesma forma, os frames semânticos são entidades conceptuais, e (ii), por um princípio da Semântica de Frames, que reza que, para saber o significado de uma palavra, é preciso ter conhecimento do frame que ela ativa. Nesse caso, o frame é uma estrutura de conhecimento mais ampla que dá informações enciclopédicas sobre o uso daquela palavra em uma comunidade de falantes. O que nossa proposta defende é que a aplicação das redes radiais tanto aos sentidos, quanto aos frames por eles evocados, adicionam diferentes informações à descrição linguística de itens polissêmicos: partindo-se das redes com sentidos, têm-se informações sobre o léxico; partindo-se das redes com frames, têm-se informações acerca das estruturas cognitivas maiores que subjazem esses sentidos, os próprios frames. Nosso estudo de corpus evidencia que essas palavras, em seus usos futebolísticos, são polissêmicas e, que, portanto, podem ser entendidas como categorias complexas. Esse resultado também corrobora a hipótese cognitivista de que a polissemia é um fenômeno regular na língua, ao contrário do que dizem as ideias apresentadas no primeiro capítulo deste trabalho, para as quais a polissemia é algo epifenomenal, isto é, secundário.
This paper aims at problematizing the treatment offered to polysemy in a frame-based lexical resource. In order to achieve such an objective, we are going to establish an approximation between Frame Semantics and the cognitivist approach to polysemy, aiming at correlating frames and lexical networks. To do so, we depart from some well-known studies about polysemy, like Brèal (1992), Ullman (1964) and Lyons (1977), in order to place the subject of this study in time and space. The second theoretical chapter in this dissertation presents the paradigm known as Cognitive Linguistics, introducing its main commitments, as well as the historical background that surrounds it. In this fashion, we approach the contributions of Evans e Green (2006). We also talk about Frame Semantics (FILLMORE, 1982), a theory situated under the scope of the cognitivist paradigm which considers meaning from the encyclopaedic point of view, not distinguishing either linguistic nor contextual information in the process of meaning assignment. We also approach the FrameNet, an online lexical resource based on the principles of Frame Semantics, in order to problematize the treatment dismissed to polysemy by such a resource. Still in the second theoretical chapter, we present the cognitivist understanding of polysemy, departing, firstly, from Langacker (1987) and Geeraerts (2006), when it comes to the notions of complex category and flexibility, respectively, and, on the second hand, from Lakoff (1987) and Fauconnier and Turner (2006), which offer theoretical models that enable one to approach polysemy, like the radial categories and the conceptual blending. The applied section of this paper consists of applying the radial categories proposed by Lakoff (1987) to the descriptions of the senses related to the noun ataque and to the verb marcar – the already known application of the lexical networks – as well as to the descriptions of the frames evoked by such senses – being this the application we propose in this dissertation. We believe that our proposal of integrating network representations and frames is justifiable once (i) it follows a Cognitive Linguistics principle according to which meaning is a conceptual entity, as well as, in the same way, frames are conceptual in nature, and (ii) it follows a principle of Frame Semantics which advocates that, to know the meaning of a word, one must necessarily be able to assign the frame evoked by such a word. In this case, a frame is a wide knowledge structure that provides encyclopaedic information about the uses of such a word in a speaking community. What our proposal advocates is that the application of radial networks not only to the senses, but also to the frames evoked by them is able to provide different kinds of information to the description of polysemous items: departing from the networks filled with senses, one finds information concerning the lexicon; departing from the networks filled with frames, one has access to wider cognitive structures which underlie these senses, that is, the frames themselves. Our corpus study shows that these words, in their uses related to football, are polysemous, and, thus, they can be considered as complex categories. This result also confirms the cognitivist hypothesis that states that polysemy is a regular phenomenon in language, in opposition to what advocate the ideas presented in the first chapter of this paper, to which polysemy is an epiphenomenon, something secondary in language.
Pierozan, Samanta Kélly Menoncin. "A metaforicidade dos phrasal verbs constituídos por up e down: uma investigação sob a ótica da semântica cognitiva." Universidade do Vale do Rio dos Sinos, 2015. http://www.repositorio.jesuita.org.br/handle/UNISINOS/4960.
Full textMade available in DSpace on 2015-11-24T11:22:06Z (GMT). No. of bitstreams: 1 Samanta Kélly Menoncin Pierozan_.pdf: 2211732 bytes, checksum: df51b6675c3c210b2dce586056eb81d4 (MD5) Previous issue date: 2015-08-24
Nenhuma
O objetivo geral deste trabalho é investigar a metaforicidade dos Phrasal Verbs (PVs) tendo-se como pilar teorias da semântica cognitiva, principalmente a Teoria da Metáfora Conceptual (TMC), desenvolvida por Lakoff e Johnson (1980). Além da TMC, no que diz respeito ao significado dos advérbios ou preposições constituintes dos PVs – os quais podem ser chamados de partículas –, consideram-se também as contribuições de Rudzka-Ostyn (2003), a qual utiliza esquemas imagéticos para representar os PVs, e de Lindner (1981), que parte da Gramática Cognitiva (LANGACKER, 1987) para analisá-los. Tendo como foco os PVs up e down, como metodologia, utiliza-se o ferramental da Linguística de Corpus, extraindo-se os PVs do Corpus of Contemporary American English (COCA). Após realizar a seleção dos Phrasal Verbs para análise, relaciona-se o significado dos PVs selecionados com os sentidos e esquemas imagéticos propostos por Rudzka-Ostyn (2003); verificam-se como como esses sentidos expressam os esquemas imagéticos propostos; identificam-se as metáforas conceptuais, em especial aquelas do tipo orientacional, conforme Lakoff e Johnson (1980); e verifica-se o mapeamento metafórico das concordâncias analisadas. Os resultados apontam que os PVs, na sua maioria, são metafóricos, e que essa metaforicidade tem forte relação com a semântica das partículas que constituem a construção verbo-partícula. Além disso, espera-se com a presente pesquisa agregar à proposta de caráter pedagógico de Rudzka-Ostyn (2003), contribuindo para o ensino e aprendizagem de PVs.
The main purpose of this study is to investigate the metaphor properties of Phrasal Verbs (PVs), based on cognitive semantic theories, especially the Conceptual Metaphor Theory, developed by Lakoff and Johnson (1980). In addition, concerning the meaning of adverbs or prepositions that constitute PVs – which can be called particles –, contributions made by Rudzka-Ostyn (2003), who uses image schemas to represent PVs, and Lindner (1981), who takes into consideration Cognitive Grammar (LANGACKER, 1987) to analyze them, are considered. The up and down particles are the focus of this investigation. Regarding methodology, Corpus Linguistics is used, and the PVs are extracted from the Corpus of Contemporary American English (COCA). After selecting them, the relation between the PVs and Rudzka-Ostyn’s image schemas is verified, as well as how their senses express the image schemas proposed by Rudzka-Ostyn (2003); conceptual metaphors, especially the orientational ones, are identified, in accordance with Lakoff and Johnson (1980); and the mapping between conceptual domains is verified. The results point that the PVs are mostly methaphoric, and that its metaphor properties are strongly related to the meaning of the particles that constitute each verb-particle construction. In addition, it is hoped this research adds to the pedagogical proposal of Rudzka-Ostyn (2003), contributing to the teaching and learning of PVs.
Gazzana, Marcos Aninkvicius. "A contribuição semântica das partículas nas verb-particle constructions: um estudo sobre 'away', 'out' e 'over' através da lingüística de corpus." Universidade do Vale do Rio do Sinos, 2008. http://www.repositorio.jesuita.org.br/handle/UNISINOS/2567.
Full textNenhuma
As Verb-Particle Constructions (VPCs) são construções verbais características da língua inglesa constituídas por um verbo e uma ou duas partículas. Tais estruturas são sintática e semanticamente complexas, uma vez que não se enquadram em regras lógicas e homogêneas. Esta pesquisa visa fazer uma reflexão sobre a semântica das partículas nas VPCs apoiada em conceitos teóricos da Gramática Cognitiva e da Lingüística Cognitiva. A contribuição semântica das partículas away, out e over é discutida valendo-se de esquemas imagéticos que permitem fazer relações entre os diferentes significados das partículas encontrados nas VPCs selecionadas para a análise. Através das ferramentas da Lingüística de Corpus, mais especificamente um concordanciador gratuito chamado AntConc 3.2.1w, foram selecionadas para a análise as cinco VPCs mais freqüentes do American National Corpus com cada partícula. Como resultado, percebeu-se que as partículas contribuem em diferentes graus para o significado total das VPCs, podendo apresentar s
Verb-Particle Constructions (VPCs) are verbal constructions typical of the English language formed by a verb and one or two particles. Such structures are syntactically and semantically complex due to the fact that they do not fit into logical and homogeneous rules. This research aims at examining the semantics of particles in VPCs within the framework of Cognitive Grammar and Cognitive Linguistics. The discussion of the semantic contribution of the particles away, out and ‘over’ is grounded in image schemas which allow establishing relations among the different meanings of particles found in the VPCs selected for the analysis. By using Corpus Linguistics tools, namely a concordancer called AntConc 3.2.1w, the five most frequent VPCs with each particle in the American National Corpus were selected for the analysis. The results showed that the particles contribute to the overall meaning of VPCs in different degrees, with more and less metaphorical senses
Gadea, Boronat Lucía. "Estudio crítico lingüístico de publicaciones periodísticas sobre la crisis financiera en España." Doctoral thesis, Universitat Politècnica de València, 2017. http://hdl.handle.net/10251/90514.
Full textEsta tesis se centra en el estudio lingüístico de publicaciones sobre la crisis financiera en España. Se trata de un acontecimiento que ha impactado sobremanera en la sociedad española y que ha generado un aluvión de información que hemos aprovechado como fuente documental. La investigación desde sus inicios persiguió radiografiar el lenguaje utilizado en artículos sobre la crisis financiera. El primer objetivo ha sido realizar una recopilación de textos con los que se ha elaborado un corpus lingüístico, el Corpus de la Crisis Financiera (CCF), lo suficientemente representativo (3,2 millones de palabras) para desarrollar una metodología de estudio de muestras reales del lenguaje periodístico sobre la crisis financiera en España en un año natural (2012) en las dos publicaciones de referencia (reflejo del bipartidismo político) por aquel entonces, El País y El Mundo. Las posibilidades que aporta el avance de las nuevas tecnologías, con los nuevos formatos digitales han favorecido la compilación, agrupación vinculada, clasificación y análisis de los textos periodísticos. De este modo, se ha elaborado un corpus especializado, a partir de textos escritos, monolingüe, sincrónico (año 2012), cerrado, codificado mediante etiquetas y finito. Revisamos las aportaciones de los teóricos de las ciencias de la comunicación para demostrar que el trabajo de redacción, que en ocasiones los periodistas realizan de manera instintiva, tiene detrás de sí toda una argumentación teórica. Comprobamos cómo los periodistas elaboran las informaciones, a través de distintos géneros, y cómo influyen en ellos las teorías de la comunicación. También cómo se han visto afectadas las informaciones por las nuevas formas de transmisión de las noticias, es decir, con la expansión de las redes sociales. Es el caso, por ejemplo, de la posverdad, en que se da más importancia a las emociones que genera una noticia que a los hechos en sí. Podremos comprobar cómo el lenguaje empleado es el vehículo de intercambio de conocimiento entre el Gobierno y la sociedad. La Lingüística de Corpus ha proporcionado la base metodológica de trabajo: hemos revisado los conceptos teóricos más relevantes y comparado los diferentes criterios a la hora de recopilar, diseñar y analizar un corpus. El análisis del CCF comenzó con el estudio cuantitativo de sus textos (frecuencias, palabras clave, líneas de concordancia, colocaciones, patrones recurrentes y clústeres) de manera automática con herramientas informáticas para, a continuación, desarrollar la interpretación cualitativa. Nuestro fin prioritario fue detectar la carga semántica y los recursos estilísticos contenidos en las publicaciones sobre la crisis financiera. Para ello, los actores sociales de la crisis (las doce personalidades del ámbito público con mayores índices de aparición en cada trimestre del año 2012) han constituido el hilo conductor del análisis del CCF. El método diseñado e implementado ha proporcionado evidencias sobre determinadas categorías semánticas que co-aparecen con estas entidades. Se han identificado matices en el mensaje a través de etiquetas evaluativas y se han detectado términos, frases y oraciones que confieren al texto gran expresividad. Las últimas fases de la investigación han consistido en al análisis manual de textos completos (macroestructura y lenguaje evaluativo) para poder establecer una categorización de los sentimientos expresados mediante diferentes mecanismos y figuras retóricas. La creación de un corpus periodístico y su análisis informático y lingüístico nos permite detectar y analizar el lenguaje evaluativo presente en los textos de forma explícita o implícita y desenmascarar evidencias sobre pensamiento político e ideológico. Este último objetivo se alcanza ya al final de la investigación en que la lectura pormenorizada de textos completos (editoriales y cartas al director) muestra la int
Aquesta tesi se centra en l'estudi lingüístic de publicacions sobre la crisi financera a Espanya. És un esdeveniment que ha causat un gran impacte en la societat espanyola i ha generat una allau d'informació que hem aprofitat com a font documental. La investigació des dels seus inicis va tractar de radiografiar el llenguatge utilitzat en la premsa econòmica. El primer objectiu ha estat realitzar una recopilació de textos amb els quals s'ha elaborat un corpus lingüístic, el Corpus de la Crisi Financera (CCF), prou representatiu (3,2 milions de paraules) com per desenvolupar una metodologia d'estudi de mostres reals del llenguatge periodístic sobre la crisi financera a Espanya en un any natural (2012) en les dues publicacions de referència (reflex del bipartidisme polític) com han estat, El País i El Mundo. Les possibilitats que aporta el progrés de les noves tecnologies, amb els nous formats digitals, han afavorit la compilació, agrupació vinculada, classificació i anàlisi dels textos periodístics. D'aquesta manera, s'ha elaborat un corpus especialitzat, a partir de textos escrits, monolingüe, sincrònic (any 2012), tancat, codificat mitjançant etiquetes i finit. Fem una revisió de les aportacions dels teòrics de les ciències de la comunicació per demostrar que el treball de redacció, que en ocasions els periodistes realitzen de manera instintiva, té com a rerefons tota una argumentació teòrica. Comprovem com els periodistes elaboren les informacions a través de diferents gèneres, i com influeixen en ells les teories de la comunicació. També com s'han vist afectades les informacions per les noves formes de transmissió de les notícies, és a dir, amb l'expansió de les xarxes socials. És el cas, per exemple, de la posveritat, on es dóna més importància a les emocions que genera una notícia que als fets en si. Podrem comprovar com el llenguatge emprat és el vehicle d'intercanvi de coneixement entre el Govern i la societat. La Lingüística de Corpus ha proporcionat la base metodològica de treball: hem revisat els conceptes teòrics més rellevants i comparat els diferents criteris a l'hora de recopilar, dissenyar i analitzar un corpus. L'anàlisi del CCF va començar amb l'estudi quantitatiu dels seus textos (freqüències, paraules clau, línies de concordança, col·locacions, patrons recurrents i clústers) de manera automàtica amb eines informàtiques per a, a continuació, desenvolupar la interpretació qualitativa. La finalitat primera va ser detectar la càrrega semàntica i els recursos estilístics continguts en les publicacions sobre la crisi financera. Per aquesta raó, els actors socials de la crisi (les dotze personalitats de l'àmbit públic amb majors índexs d'aparició en cada trimestre de l'any 2012) han estat el fil conductor de l'anàlisi del CCF. El mètode dissenyat i implementat ha proporcionat evidències sobre determinades categories semàntiques que coapareixen amb aquestes entitats. S'han identificat matisos en el missatge a través d'etiquetes d'avaluació i s'han detectat termes, frases i oracions que confereixen al text gran expressivitat. Les últimes fases de la recerca han consistit en l'anàlisi manual de textos complets (macroestructura i llenguatge avaluatiu) per tal de poder establir una categorització dels sentiments expressats mitjançant diferents mecanismes i figures retòriques. La creació d'un corpus periodístic i la seva anàlisi informàtica i lingüística ens permet detectar i analitzar el llenguatge avaluatiu present en els textos de manera explícita o implícita i desemmascarar evidències sobre pensament polític i ideològic. Aquest últim objectiu s'aconsegueix ja al final de la investigació quan la lectura detallada de textos complets (editorials i cartes al director) mostra la intenció i posició dels autors respecte a la crisi financera.
Gadea Boronat, L. (2017). Estudio crítico lingüístico de publicaciones periodísticas sobre la crisis financiera en España [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/90514
TESIS
Avilés, Vergara Tania. "El español de Chile en el ciclo de expansión del salitre (1880-1930). Edición lingüística de un corpus epistolar para su estudio." Tesis, Universidad de Chile, 2014. http://www.repositorio.uchile.cl/handle/2250/117047.
Full textNo autorizada su publicación a texto completo, según petición de su autor
La presente investigación, a caballo entre las disciplinas de la filología hispánica — de enfoque histórico y perspectiva lingüística— y la historia de la lengua española, tiene como objetivo general establecer una edición lingüística de un corpus de 40 cartas manuscritas originales y de testimonio único, escritas por obreros del salitre de la Región de Tarapacá y sus familiares, para contribuir a dar testimonio de variantes lingüísticas vulgares de baja frecuencia o poco atendidas en la bibliografía especializada (metalingüística y lingüística), y que a causa de su desconocimiento han sido enmendadas, corregidas o ignoradas en las ediciones de la tradición filológica peninsular. Esta última idea corresponde a la hipótesis de trabajo del proyecto FONDECYT Regular Nº 1120089 Rasgos de lengua vulgar encubiertos en las ediciones críticas, dirigido por la Dra. Raïssa Kordić Riquelme, en el cual se enmarca nuestro estudio y al cual pretende aportar con sus hallazgos. Para el establecimiento del discurso de las cartas, hemos utilizado como método el estudio detallado del ductus y usus scribendi de cada autor, complementando estos resultados con el conocimiento de la variedad lingüística en estudio, a saber, el español vulgar del centro-sur de Chile trasplantado a la región de Tarapacá durante el ciclo de expansión del salitre, entre los años 1880 y 1930, aproximadamente. Una vez que fueron seleccionadas las variantes vulgares, fonéticas y morfológicas, para su estudio lingüísticohistórico, se revisó un importante aparato bibliográfico para documentar estos hechos de lengua y corroborar su calidad de legítimos y auténticos del español histórico. Los resultados de este proceso demostraron que, efectivamente, existen fenómenos lingüísticos vulgares poco conocidos y que se encuentran escasamente testimoniados en la bibliografía consultada. Se establece, por tanto, una lista de los fenómenos fónicos y morfológicos más destacables, que deben ser considerados como hechos legítimos de lengua vulgar por la crítica textual y la historia de la lengua.
Santos, Gilnei Magnus dos. "Proposta de elaboração de glossário terminológico bilíngue para a área de agropecuária - sob a perspectiva da linguística de corpus." reponame:Repositório Institucional da UFSC, 2015. https://repositorio.ufsc.br/xmlui/handle/123456789/169518.
Full textMade available in DSpace on 2016-10-19T13:04:33Z (GMT). No. of bitstreams: 1 338986.pdf: 4534456 bytes, checksum: 6a18cd3dad8f48d17fd202233b463bfd (MD5) Previous issue date: 2015
A presente investigação é desenvolvida a partir de um só fio condutor, a saber: em que medida o aperfeiçoamento teórico e metodológico na área dos Estudos da Tradução e, particularmente, no campo da Lexicografia, Terminologia e da Linguística de Corpus, conduz a aprimoramentos com vistas à elaboração de glossários terminológicos bilíngues na área da Agropecuária? Trata-se, com efeito, de considerar, como ponto de partida e como componente instigador, um glossário elaborado em 2006, pelo próprio autor desta tese que, com o passar dos anos, sentiu necessidade de conceder ao seu produto de base, incrementos com bases científicas. Objetivando expor os aportes que a ciência atual oferta aos lexicógrafos para a elaboração de glossários, explicitam-se, nesta tese, alguns dos principais percursos teóricos e metodológicos adotados para contribuir com um novo projeto de glossário. Para fazê-lo, unem-se conhecimentos empíricos, adquiridos ao longo dos anos e através da prática, aos conhecimentos da linguística lexical quantitativa e da tradução. A reflexão teórica e investigatória acerca dos fazeres lexicográfico e terminográfico, em conjunto com estudos de corpora, cujos dados obtidos evidenciaram que os corpora comparáveis compilados para os propósitos da pesquisa são fonte para validação dos termos, contribuem para o aprimoramento do glossário técnico em questão (Santos, 2006). Em adição, essa pesquisa pode vir a subsidiar propostas metodológicas com vistas à produção de materiais de suporte à tradução que atendam aos interesses de especialistas da área, professores e alunos de cursos técnicos e superiores voltados à área da agropecuária.
Abstract : This research is carried from a single common thread that aims to know the extent to which the theoretical and methodological developments in Translation Studies, particularly in Lexicography, Terminology and Corpus Linguistics fields, lead to improvements with a view to creating bilingual terminology glossaries on farming areas. It considers, as a starting point and as an instigator component, a glossary elaborated in 2006, by the author of this doctoral dissertaton that over the years felt the need to give to their basic product, increments with scientific bases. Aiming to expose the contributions that current science offers to the lexicographer for glossary compilation, it is described in this study some of the main theoretical and methodological pathways adopted to contribute to a new glossary project. To do that, empirical knowledge acquired over the years and through practice is joined to the lexical knowledge of quantitative linguistics and translation. The theoretical and investigative reflection on lexicography, terminography and corpora studies, whose data obtained showed that the comparable corpora compiled for research purposes are source for validation of the terms, contribute to the improvement of the technical glossary elaborated by the author (Santos, 2006). In addition, this research may ultimately subsidize methodological proposals related to translation support material production in order to help experts on that field, teachers and students of technical and higher education courses interested in agricultural area.
Coll-Florit, Marta. "La modalitat de l'acció. Anàlisi empírica, reformulació teòrica i representació computacional." Doctoral thesis, Universitat Oberta de Catalunya, 2009. http://hdl.handle.net/10803/9125.
Full textThis thesis presents a new model of aspectual classification and representation which is valid for theoretical approaches as well as for applied models, such as computational lexicography. The main contributions of this work can be summarized in three basic points. Firstly, it accounts for different constraint degrees in the interaction between lexical aspect and sentential context, while sheding light on the gradual nature and inherent prototipicity effects of Aktionsart, thus offering a contiguous circle of aspectual categories which opens new ways for understanding the shift between categories. Secondly, aspectual polysemy, and more specifically the relationship between Aktionsart and selectional restrictions, is accounted for, allowing the formulation of new criteria in order to distinguish verbal senses, which is one of the main needs of Natural Language Processing resources. Finally, and more interestingly, this model has been validated empirically by means of corpus linguistic techniques and psycholinguistic experiments.
Mendoza, de la Luz Frida Sofia. "Caracterización sociolingüística del habla de la comunidad de Santiago Puriatzícuaro, Michoacán." Tesis de Licenciatura, Universidad Autónoma del Estado de México, 2019. http://hdl.handle.net/20.500.11799/110305.
Full textCosta, Alessandra Bautista da. "Metaforas relacionadas ao tema da amizade sob a perspectiva da teoria da metáfora conceptual e da lingüística corpus na série TV'Friends." Pontifícia Universidade Católica de São Paulo, 2005. https://tede2.pucsp.br/handle/handle/14052.
Full textPontificia Universidade de São Paulo
This study looked at the theme of friendship as it is presented in the American sitcom Friends. The research was carried out by focusing on metaphors and how these metaphors relate to friendship, love and other similar themes. In order to accomplish the aim proposed above, this research drew on Corpus Linguistics as well as on the Conceptual Metaphor Theory. Corpus Linguistics was used as a theoretical approach and methodology which takes into account large bodies (corpora) of natural linguistic data and a probabilistic view of language. In this study, several computer tools such as Concord, Collocates and Clusters in the software WordSmith Tools 3.0 (Scott, 1998) were employed. According to Lakoff (1993:203), metaphor can be understood as a cross-domain mapping in the conceptual system . The results showed there are several metaphors in the sitcom Friends that lead us to conceptualize friendship in many different ways, such as: LOVE IS CRAZYNESS, LOVE AS A JOURNEY, BOY/GIRLFRIENDS ARE SWEET, for example. As a general conclusion, we may say that the sitcom Friends draws on a number of metaphors centering around the theme of friendship which in turn lends consistency and thematic unit to the series as a whole. Moreover, in a sense, the series redefines friendship, by blending topics such as sex, childhood, youth and partnership. Arguably, part of the success of the series may be due to these
Este trabalho teve como objetivo principal propor o levantamento de metáforas lingüísticas no corpus de estudo (seriado de TV Friends) e a categorização das mesmas em metáforas conceptuais relacionadas ao tema da amizade. A motivação do estudo surgiu da necessidade de ensinar vocabulário de inglês como língua estrangeira e do desejo de incorporar, no ensino, episódios do seriado norte-americano Friends. A escolha do corpus deveu-se a essa motivação adicional. Espera-se que em outra pesquisa possamos passar dos achados de pesquisa à sua utilização no contexto de ensino de línguas estrangeiras. Para que o propósito acima fosse realizado, esta pesquisa integrou duas áreas de pesquisa, a da Lingüística de Corpus e a da Teoria da Metáfora Conceptual. A Lingüística de Corpus é uma abordagem teórica metodológica que se norteia a partir da observação de dados lingüísticos naturais e de uma visão probabilística da linguagem. Neste estudo, a Lingüística de Corpus fez-se presente, metodologicamente, por meio de várias ferramentas computacionais, como Concord, Collocates e Clusters, oferecidas pelo programa utilitário WordSmith Tools 3.0 (Scott, 1998). Tais ferramentas foram utilizadas para realizar o levantamento de metáforas lingüísticas, revelando, dessa forma, as metáforas conceptuais estudadas por Lakoff e Johnson (1980/2002). Entende-se por metáfora um mapeamento entre domínios que faz parte de um sistema conceptual (Lakoff, 1993). Adotou-se, aqui, a Teoria da Metáfora Conceptual como o arcabouço teórico que permitiu a identificação das metáforas do corpus do seriado Friends. Os resultados indicaram várias metáforas presentes no seriado Friends que remetem ao tema da amizade de diversas maneiras, como nos exemplos: AMOR É LOUCURA, AMOR COMO VIAGEM, NAMORADOS/AS SÃO COMO UM ALIMENTO DOCE, etc. A conclusão geral é que as metáforas freqüentes no seriado não somente dão a tônica ao conjunto dos episódios, dessa forma trazendo consistência a uma série longa como essa, mas também, e talvez principalmente, redefinem o conceito de amizade como o conhecemos, incorporando noções de sexo, infantilidade, jovialidade e companheirismo. Parte do sucesso da série pode ser, talvez, atribuída à escolha feliz e consistente de metáforas que aludem aos temas principais da série. A pesquisa pretende ter dado uma contribuição original para a área da Lingüística de Corpus na interface com a Teoria da Metáfora Conceptual, na medida em que integra questões referentes à sua visão de linguagem, com princípios teóricos e metodológicos referentes à aprendizagem de vocabulário por meio das metáforas conceptuais propostas por Lakoff e Johnson (1980/2002)
Garcia, Sebastià Josep Vicent. "Les construccions de temps transcorregut en el català de l’edat moderna i contemporània: acostament segons la lingüística de corpus i la gramàtica cognitiva." Doctoral thesis, Universidad de Alicante, 2018. http://hdl.handle.net/10045/98369.
Full textSerpa, Talita [UNESP]. "A cultura brasileira de Darcy Ribeiro em língua inglesa: um estudo da tradução de termos e expressões de antropologia da civilização." Universidade Estadual Paulista (UNESP), 2012. http://hdl.handle.net/11449/93883.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Com o propósito de investigar os comportamentos linguístico-tradutório e social de dois tradutores diante dos obstáculos impostos pelos limites culturais na Tradução, analisamos um corpus paralelo da subárea de especialidade da Antropologia da Civilização, composto pelas obras O processo civilizatório: etapas da evolução sociocultural (1968) e O povo brasileiro: a formação e o sentido do Brasil (1995), de autoria do antropólogo Darcy Ribeiro e pelas respectivas traduções para a língua inglesa, realizadas por Betty J. Meggers e Gregory Rabassa.Também nos valemos de dois corpora comparáveis de Antropologia em português e em inglês, e de um corpus de apoio composto principalmente por dicionários de Ciências Sociais e Antropologia. Os principais objetivos que nortearam a presente pesquisa foram: observar a tradução de termos e expressões das obras darcynianas, assim como verificar o processo tradutório concernente aos brasileirismos e neologismos terminológicos elaborados pelo autor; investigar o comportamento linguístico-cultural dos tradutores, por meio da análise das opções por eles utilizadas nas traduções e dos traços de simplificação e explicitação nos textos traduzidos; e elaborar dois glossários bilíngues para a terminologia antropológica. Para tanto, apoiamo-nos na abordagem interdisciplinar proposta por Camargo (2005, 2007), adotando, para o levantamento e processamento eletrônico dos dados, o arcabouço teórico-metodológico dos Estudos da Tradução Baseados em Corpus (BAKER, 1993, 1995, 1996, 2000), da Linguística de Corpus (BERBER SARDINHA, 2004, 2010; TOGNINI-BONELLI, 2001) e, em parte, da Terminologia (BARROS, 2004; KRIEGER & FINATTO, 2004, FAULSTICH, 1995, 2000). No tocante à análise dos dados levantados, adotamos os trabalhos de Sociologia da Tradução...
Intending to investigate the social and translational linguistic behaviors of two translators in face of obstacles imposed by cultural barriers in translation, we analyzed a parallel corpus of Social Anthropology of Civilization sub-area, composed by the works, O processo civilizatório (1968) e O povo brasileiro (1995), written by the anthropologist Darcy Ribeiro, as well as by their translations into English, performed by Betty J. Meggers and Gregory Rabassa, respectively. We also used two comparable corpora of Anthropology in Portuguese and in English, and a support corpus composed mainly of dictionaries of Social Sciences and Anthropology. The main objectives that guided this research were: to observe the translation of terms and expressions in Darcy Ribeiro’s works, to analyze the translational process concerning to the terminological Brazilianisms and neologisms produced by the author; to investigate the translators’ linguistic and cultural behavior through the analysis of resources used by them in their translations; to identify simplification and explicitation features in the two translated texts; and to elaborate two bilingual glossaries for anthropological terminology. With these purposes, we based our study on Camargo’s interdisciplinary proposal (2005,2007) adopting, for the electronic collection and processing of data, the theoretical and methodological framework of Corpus-Based Translation Studies (Baker, 1993, 1995, 1996, 2000), of Corpus Linguistics (BERBER SARDINHA, 2004, 2010, TOGNINI-BONELLI, 2001) and, in part, of Terminology (BARROS, 2004; KRIEGER & FINATTO, 2004, FAULSTICH, 1995, 2000). Concerning the classification and analyzes of data gathered from our corpora, we based our research... (Complete abstract click electronic access below)
Grigoleto, Grace Gonçalves [UNESP]. "Análise de vocábulos recorrentes e preferenciais na obra As mulheres de Tijucopapo, de Marilene Felinto, e na respectiva tradução para o inglês The women of Tijucopapo, realizada por Irene Mathews, com base em aspectos de normalização." Universidade Estadual Paulista (UNESP), 2011. http://hdl.handle.net/11449/93905.
Full textO presente trabalho tem por objetivo analisar a tradução de vocábulos considerados recorrentes e preferenciais na obra As mulheres de Tijucopapo, de Marilene Felinto, bem como observar possíveis tendências de normalização por parte da tradutora Irene Matthews na tradução para o inglês: The women of Tijucopapo. Esta pesquisa é parte de um projeto maior, o PETra – Padrões de Estilo de Tradutores, coordenado pela Profa. Dra. Diva Cardoso de Camargo. A metodologia situa-se no campo dos estudos da tradução baseados em corpus (proposta de Baker, 1993, 1995, 1996, 2000, 2004; estudos sobre normalização de Scott, 1998; e pesquisas de Camargo, 2005, 2007), e no da linguística de corpus (estudos de Berber Sardinha, 2003, 2004); também se apoia na fortuna crítica da autora (trabalhos de Araújo, 2006; Bailey, 2010; Fiorucci, 2009; Gonçalves, 2001; Jacomel, 2008; Santos, 2005; Schmidt, 2009; Vieira, 2001; Wanderley, 2009 e Xavier, 2003). A pesquisa foi realizada por meio de uma combinação de análises semimanuais e de análises computadorizadas. Inicialmente, utilizamos o programa WordSmith Tools para obter a frequência das palavras na obra de Felinto. Em seguida, utilizamos a ferramenta KeyWords para identificar quais seriam as palavras-chave presentes no romance. Após esse levantamento, recorremos à fortuna crítica de Felinto e definimos cinco vocábulos considerados preferenciais da autora:homem, mulheres, chuva, amor e égua. Com base em Scott (1998), examinamos a tradução dos cinco vocábulos em relação a nove características de normalização. Os resultados encontrados nesta pesquisa mostram que a tradutora Irene Matthews tende a usar estratégias que podem ser identificadas como características de normalização
This thesis aims at analyzing the translation of words considered recurring and preferred in the novel As mulheres de Tijucopapo, by Marilene Felinto, as well as observing possible tendencies of normalization by the translator Irene Matthews in the translation to English: The women of Tijucopapo. This research is part of a bigger project, the PETra (Padrões de Estilo de Tradutores), coordinated by Doc. Diva Cardoso de Camargo. The methodology employed is that of corpus-based translation studies (proposed by Baker, 1993, 1995, 1996, 2000, 2004; Scott‘s study concerning normalization, 1998; and Camargo‘s research studies, 2005, 2007), and that of corpus linguistics (Berber Sardinha‘s study, 2003, 2004). We also base our study on Felinto‘s critical heritage (studies by Araújo, 2006; Bailey, 2010; Fiorucci, 2009; Gonçalves, 2001; Jacomel, 2008; Santos, 2005; Schmidt, 2009; Vieira, 2001; Wanderley, 2009, and Xavier, 2003). The research was carried out by means of a combination of semi- manual and computerized analyses. Initially, we used the computer software WordSmith Tools to obtain the frequency of the words in Felinto‘s book. Then, we went on to use the tool KeyWords to identify which would be the keywords in the author‘s novel. After collecting these data, we used Felinto‘s critical heritage in order to select five words that could be considered as recurring and preferred in Felinto‘s writing: 'homem‘ ('man‟), 'mulheres‘ ('women)‘, 'chuva‘ ('rain‘), 'amor‘ ('love‘) and 'égua‘ ('mare‘). Based on Scott (1998), we analyzed the translation of the five selected words in relation to nine normalization features. The results obtained in this study show that the translator Irene Matthews tends to use strategies that may be identified as features of normalization
Murakami, Thiery Okuyama Silva. "Extração de redes léxicos-semânticas do português em um corpus de turismo." reponame:Repositório Institucional da UFABC, 2011.
Find full textSouza, Diego Spader de. "Jogada de letra: um estudo sobre colocações à luz da semântica de frames." Universidade do Vale do Rio dos Sinos, 2015. http://www.repositorio.jesuita.org.br/handle/UNISINOS/3924.
Full textMade available in DSpace on 2015-06-17T13:30:29Z (GMT). No. of bitstreams: 1 Diego Spader de Souza.pdf: 2206624 bytes, checksum: 30715b12e44b6bedea8e7f523b159982 (MD5) Previous issue date: 2015-03-30
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
O objetivo da presente dissertação é discutir a relação existente entre o fenômeno linguístico das colocações e os conceitos da teoria da Semântica de Frames (FILLMORE, 1982; 1985). O trabalho se insere no contexto de dois projetos de pesquisa desenvolvidos pelo grupo SemanTec, o Field – Dicionário de Expressões do Futebol (CHISHMAN, 2014), já disponível para consulta na web, e o Dicionário Eletrônico Modalidades Olímpicas (CHISHMAN, 2014), ainda em fase inicial. Os dois dicionários citados se organizam a partir da noção de frame semântico proposta por Fillmore (1982; 1985), de forma que a dissertação busca evidenciar de que forma esse conceito (e os conceitos que o cercam) repercutem no tratamento lexicográfico dispensado às colocações. Nesse sentido, a revisão da literatura, apresentada nos capítulos 2 e 3, discute as bases teóricas para o estudo das colocações e da Semântica de Frames. O método da pesquisa consiste na análise de 74 colocações da linguagem do futebol. A escolha dessas estruturas parte do estudo de 500 combinações lexicais extraídas a partir de um corpus em português brasileiro do discurso do futebol através do software Sketch Engine. A análise das 74 colocações selecionadas acontece em duas fases: a primeira se dedica a averiguar os aspectos quantitativos do conjunto de dados e as características estruturais das colocações da linguagem do futebol; a segunda etapa foca na relação dessas combinações com os preceitos teóricos da Semântica de Frames e da sua contraparte computacional, a FrameNet, a fim de perceber de que modo esse arcabouço teórico oferece subsídios para o tratamento das colocações em contextos lexicográficos. Entre os principais resultados da primeira fase de análise, destaca-se o fato de que a maior parte das colocações do futebol designa estruturas verbais, como fazer gol e mandar bola, o que demonstra que a linguagem esportiva é marcada pela dinâmica das ações e dos eventos que ocorrem durante a partida. Além disso, foi possível perceber que as colocações nominais estão fortemente ligadas aos materiais, participantes e locais do contexto futebolístico. A segunda parte demonstrou que as colocações, no âmbito de dicionários baseados em frames, atuam como unidades lexicais, conceito proveniente da FrameNet. Ao serem consideradas unidades lexicais, as colocações são evocadoras de frame, o que as caracteriza como termos que devem estar presentes na lista principal de verbetes. Foi possível notar, contudo, que a evocação de frame a partir das colocações muitas vezes não segue o modelo tradicional presente na FrameNet, especialmente quando se trata das colocações nominais, que não evocam acontecimentos, mas entidades estáticas, como cartão vermelho e tabela de classificação. A presente dissertação evidencia a relevância da Semântica de Frames e da FrameNet para o estudo de unidades complexas como as colocações em contextos lexicográficos. Outro aspecto a ser mencionado é a importância dos recursos metodológicos da Linguística de Corpus para a área em que o estudo se insere.
The present thesis aims at the discussion of the relation that exists between the linguistic phenomenon of collocations and the concepts of Frame Semantics theory (FILLMORE, 1982; 1985). The study has arisen in the context of two research projects developed by the SemanTec group, Field – Football Expressions Dictionary (CHISHMAN, 2014), already available on the web, and Olympic Modalities Electronic Dictionary (CHISHMAN, 2014), still in early stage. Both dictionaries are organized around the notion of semantic frame proposed by Fillmore (1982; 1985), in such a way that the thesis seeks to demonstrate in which way this concept (and the concepts surrounding it) are related to the lexicographic treatment given to collocations. Thus, the literature review, presented in chapters 2 and 3, discusses the theoretical basis of the studies of collocations and Frame Semantics. The research method consists of the analysis of 74 collocations of football language. The choice of these structures was made after the study of 500 lexical combinations extracted from a Brazilian Portuguese corpus of football discourse through the Sketch Engine software. The analysis of the 74 collocations happens in two steps: the first one is dedicated to investigate the quantitative aspects of the data set and the structural characteristics of football language collocations; the second phase focuses on the relation between these combinations and the theoretical assumptions of Frame Semantics and its computational counterpart, FrameNet, in order to see in which way this theoretical outline treats collocations in lexicographic contexts. Among the main results of the first phase of analysis is the fact that a major part of football collocations are verbal, such as score goal and send the ball, which demonstrates that sport language is marked by the dynamics of actions and events that take place in a game. Besides, it was also possible to realize that nominal collocations are strongly connected to the materials, participants and places of football context. The second phase demonstrated that collocations in the scope of frame-based dictionaries act as lexical units, concept arising from FrameNet. Because they are considered lexical units, collocations are seen as frame evokers, thus characterizing them as terms that must be displayed in the main list of entries. However, it was also possible to note, however, that the frame evoking by collocations many times does not follow the traditional model of FrameNet, especially when it comes to nominal collocations that do not evoke events, but static entities, such as red card and classification table. The present thesis evidences the relevance of Frame Semantics and FrameNet for the study of complex units such as collocations in lexicographic contexts. Another aspect to be mentioned is the importance of the methodological resources of Corpus Linguistics to the area in which this study is included.
Marín, Pérez María José. "Identificación y análisis del vocabulario especializado de los repertorios de jurisprudencia británicos : estudio basado en un corpus de este género legal, fundamento de los sistemas legales Common Law= Identification and analysis of the specialised vocabulary of british law reports : a corpus-driven study of this legal genre at the core of Common Law legal systems." Doctoral thesis, Universidad de Murcia, 2013. http://hdl.handle.net/10803/128621.
Full textThis doctoral thesis aims at identifying and analysing the specialised vocabulary in BLaRC (the British Law Report Corpus), an ad hoc legal corpus of British Law Reports of 8.85 million words, which is described and justified in detail in chapter 2. In order to do so, ten different ATR methods are implemented on a 2.6 million word corpus, UKSCC (the United Kingdom Supreme Court Corpus), extracted from the main one to facilitate their implementation and validation process. Chapter 3 is devoted to the evaluation of such ATR methods as regards the precision levels achieved in term identification by each of them. Average precision is calculated through the automatic comparison of the lists of candidate terms (CTs) produced by each method with a gold standard, that is, an electronic legal glossary of 10,088 entries, also compiled for this research. Cumulative precision is measured following the same procedure so as to observe and compare the way it evolves as the number of identified terms augments. As a result, Terminus 2.0 (Nazar & Cabré, 2012) and TermoStat (2003), the best performing techniques, are selected with the aim of implementing them on BLaRC. After doing so, the validated lists of both single and multi-word legal terms extracted from it are offered in section 3.2.4. Chapter 3 ends with the proposal of some activities aimed at illustrating the varied applications and uses of specialised corpora and vocabulary lists in ESP teaching. Owing to the relevance of sub-technical vocabulary as a major component of the legal lexicon, a quantitative method is proposed in chapter 4 to measure its degree of specialisation based on the context of usage of this type of words. William’s (2001) lexical network model is applied to a set of general, highly specialised and sub-technical words in order to observe and compare the number and frequency of their collocates and co-collocates both in BLaRC, the specialised corpus, and LACELL, the general one. The observation of the data obtained leads to the formulation of the algorithm Sub-Tech allowing to place the words analysed along a continuum of specialisation depending on the data obtained after the implementation of Williams’ model. Finally, with the purpose of describing sub-technical vocabulary from a semantic perspective, Cantos and Sánchez’s (2001) lexical constellation model is applied to analyse the semantic features of the shared terms trial, charge and battery resulting into a much clearer picture of the process undergone by sub-technical words from general usage to specialisation. The application of this model in combination with the quantitative method described above may be regarded as a first step towards a better understanding of a lexical phenomenon which, to the best of our knowledge, has not been explored in depth to date.
Ginezi, Luciana Latarini. "Cafés do Brasil: estudo de variantes em português e inglês na língua falada." Universidade de São Paulo, 2008. http://www.teses.usp.br/teses/disponiveis/8/8147/tde-03042008-134508/.
Full textThe aim of this research is to analyze the presence of terminological variants in the specialty language of coffee and to verify the possibility of building a bilingual vocabulary based on spoken language. The study is guided by the consecutive or liaison interpreting and the use of spoken corpora, once we can establish a close relation between spoken language and interpreting, oral mode of translation. Several difficulties were faced in order to build the spoken corpora, and they are presented with some suggestions for future research. The principles of Corpus Linguistics are followed to the corpora design, as well corpora exploration, using Mike Scott\'s WordSmith Tools. The study is significant due to the knowledge of terminological variants in spoken language, by interpreters and professional workers at a specialty area, and also to the possibilities Corpus Linguistics offers to a socioterminological research at spoken variety. Two monolingual spoken corpora were compiled, one in Brazilian Portuguese and the other in English spoken world-wide. The main topic is Coffee, divided in harvest and processing, with face to face interviews as well as conversations among coffee professionals, in both languages. An interpreting corpus is also included in the work, between Portuguese and English speakers. After analysis, we present a bilingual vocabulary of spoken language, including the variants found for most of the terms.
Paiva, Paula Tavares Pinto [UNESP]. "Estudo em corpora de traduções e três glossários bilíngues nas subáreas de anestesiologia, cardiologia e ortopedia." Universidade Estadual Paulista (UNESP), 2006. http://hdl.handle.net/11449/93900.
Full textEste estudo examinou traduções de termos médicos de maior freqüência em três subáreas médicas: anestesiologia, cardiologia e ortopedia, bem como observou traços de simplificação e de explicitação apresentados pelos tradutores de cada subárea. Para tanto, fundamentamo-nos, principalmente, nos Estudos da Tradução Baseados em Corpus (Baker, 1993, 1995, 1996; Camargo, 2004, 2005), na Lingüística de Corpus (Berber Sardinha, 2000, 2004; Tognini-Bonelli, 2001) e em parte, na Terminologia (Aubert, 1996; Barros, 2004; Krieger & Finatto, 2004). Para a compilação do corpus de estudo, foram utilizados artigos científicos de revistas brasileiras bilíngües e de revistas estrangeiras de renome na comunidade médica das respectivas subáreas. A pesquisa conta com o auxílio de três ferramentas: WordList, KeyWords e Concord, disponibilizadas pelo programa WordSmith Tools versão 3.0. A comparação dos termos médicos das três subáreas foi feita a partir de um corpus paralelo de textos originais e de textos traduzidos, e de dois corpora comparáveis de textos de mesma natureza originalmente escritos em português e em inglês. O levantamento de termos médicos mais freqüentes em português para cada subárea permitiu a elaboração de um glossário com os respectivos termos equivalentes em inglês, acompanhados do seu contexto em ambas as línguas. O exame de traços de simplificação e de explicitação possibilitou a identificação de estratégias por parte dos três tradutores diante de textos das respectivas subáreas médicas.
The present study aims at observing the most frequent medical terms in Portuguese and their translation into English from three medical fields, Anesthesiology, Cardiology and Orthopaedics, as well as examining aspects of simplification and explicitation shown in the respective translator's texts from each medical area. The methodology adopted is that of Corpus-based Translation Studies (Baker 1993, 1995, 1996; Camargo, 2004, 2005), Corpus Linguistics (Berber Sardinha, 2000, 2004; Tognini-Bonelli, 2001); and Terminology (Aubert, 1996; Barros, 2004; Krieger & Finatto, 2004). For compiling the main corpus, we used scientific papers from bilingual Brazilian journals and foreign journals well-known in their respective medical fields. This study used three tools: WordList, KeyWords and Concord, from the software WordSmith Tools version 3.0. A comparison of medical terms was carried out based on a parallel corpus of original and translated texts, and on two comparable corpora composed by texts originally written in Portuguese and in English. After listing and analyzing the most frequent medical terms in Portuguese, we compiled a glossary with the respective equivalents in English followed by their contexts in both languages for each of the three medical areas. The observation of simplification and explicitation features revealed strategies used by the three translators when dealing with medical texts.
Hernández, Maya Paloma Teresa. "DESEMPEÑO DE LOS MÉTODOS DEL ESTADO DEL ARTE PARA LA GENERACIÓN AUTOMÁTICA DE RESÚMENES EXTRACTIVOS PARA EL CORPUS TEXTRUSS." Tesis de Licenciatura, Universidad Autónoma del Estado de México, 2018. http://hdl.handle.net/20.500.11799/99589.
Full textRodríguez, Inés Patricia. "Uso de corpus electrónicos en la formación de traductores (inglés-español-inglés)." Doctoral thesis, Universitat Autònoma de Barcelona, 2008. http://hdl.handle.net/10803/286111.
Full textEl objetivo general de esta tesis es integrar el uso de corpus electrónicos en la enseñanza de la traducción. Para llegar a éste nos planteamos los siguientes objetivos específicos: 1) Elaborar el marco conceptual de la lingüística de corpus y sus campos de aplicación. 2) Elaborar el marco conceptual de la didáctica de la traducción apropiado para integrar la metodología de la lingüística de corpus. 3) Diseñar una propuesta de uso de corpus electrónicos en la enseñanza de la traducción. 4) Evaluar la propuesta diseñada de uso de corpus electrónicos en la enseñanza de la traducción. La tesis está organizada en tres partes: La Parte I está dedicada a la lingüística de corpus en general y su aplicación a la traducción. La Parte II recoge el marco conceptual de la didáctica de la traducción para justificar la posterior integración de la metodología de la lingüística de corpus en la formación por competencias. Lo más destacable aquí es el Capítulo 6, en el que se presenta el marco de la propuesta que se realiza en esta tesis. Se ubica la competencia "uso de corpus para traducir" dentro de la competencia traductora; se desglosan los objetivos de aprendizaje, así como se explicitan los objetivos relacionados con competencias genéricas y con materias de traducción, se desarrollan los bloques de contenidos incluidos en la propuesta y el marco metodológico en que ésta se inscribe; se comentan las materias de traducción en las que se aplica el uso de corpus; se justifican la selección y ubicación de las unidades didácticas diseñadas; se explican los criterios para la elaboración de dichas unidades y se pone de relieve la variedad de las mismas. También se trata la cuestión de la evaluación dentro de la propuesta, se exponen las herramientas creadas para este fin y se ofrecen ejemplos reales de su puesta en práctica. La Parte III muestra la aplicación concreta de la propuesta de unidades didácticas, es decir, todas las unidades diseñadas, completas y probadas en el aula. Hay unidades de traducción directa e inversa, general y especializada.
The general goal of this thesis is the incorporation of the use of electronic corpora into translation training. To that end, I set out to fulfil the following specific goals: 1) Establishing a theoretical framework of corpus linguistics and its fields of application. 2) Establishing a theoretical framework of translator training with a view to incorporating corpus linguistics methodology into such training. 3) Designing a proposal for the use of electronic corpora in translator training. 4) Assessing the said proposal. The thesis is organised into three parts: Part I focuses on corpus linguistics in general and its application to translation. Part II deals with the theoretical framework of translator training to explain the reasoning behind my aim of integrating corpus linguistics methodology into competence-based training. The most noteworthy section is Chapter 6, in which I set out the methodological framework corresponding to the proposal I put forward in the thesis. Firstly, I identify the competence of "using corpora to translate" as a sub-competence of translation competence. I then provide a breakdown of the learning goals involved and specify the goals related to generic competences and translation subjects, before developing the proposal's methodological framework and the units of content included in the proposal. Following some observations on the translation subjects in which I use corpora, I explain the thinking behind the selection and order of the teaching units I have designed and the criteria applied to their production, emphasising their varied nature. I also cover the matter of assessment within the proposal, present the tools created for that purpose and give real examples of the proposal's implementation. Part III features all the teaching units designed as part of the proposal, in full. Each unit has been piloted in the classroom. There are units on specialised and general translation into and out of the mother tongue.