Faz sentido cobrar por palavra? Talvez, mas o que é, afinal de contas, uma palavra?

Faz sentido cobrar por palavra? Talvez, mas o que é, afinal de contas, uma palavra?

Tradutores e revisores podem cobrar seus serviços por laudas ou palavras. Nenhum destes métodos é praxe, e ambos terão defensores e detratores. Pessoalmente, julgo a lauda uma unidade melhor que a palavra. Para compreender porquê, antes de mais nada, seria bom revermos nossas certezas sobre o que seria uma palavra, e sobre a importância do conceito de palavra para o estudo das línguas e para a prática da tradução. Este texto é dedicado a essa tarefa.

O que é uma palavra?

Possivelmente, nossa intuição trata a palavra como uma determinada unidade lingüística basilar para a composição do discurso, dotada de um mínimo de unidade semântica; adicionalmente, com o advento da escrita (especialmente, talvez, em sua forma moderna, e dada a preponderância do alfabeto romano), a palavra grafada—uma unidade não exatamente semântica, mas ortográfica, separada das demais por espaços—passou a ter preponderância em nossa imaginação sobre o conceito de palavra, pois, na escrita, é possível vê-las e contá-las de um modo que nem sempre é fácil (ou mesmo relevante) na fala. Não obstante, um estudo mais aprofundado da estrutura das línguas e do léxico nos mostrará que a palavra é uma unidade problemática.

Os exemplos mais prototípicos de palavras são os substantivos não compostos como cachorro, escola, música, etc. Mas aquilo a que chamamos palavra se confunde com outras unidades lingüísticas maiores e menores que esses simples exemplos; as menores nos mostram que as palavras não são o mínimo múltiplo comum das línguas; as maiores possuem o mesmo tipo de unidade semântica. Nosso léxico mental—ou seja, o conjunto de unidades que armazenamos na mente para poder falar uma língua natural—é composto por muito mais do que palavras, e alguns desses itens acabam demonstrando que nossa compreensão da palavra, demasiadamente calcada na palavra escrita, apresenta limitações. Vejamos agora algumas dessas unidades.

1. Clíticos

Em primeiro lugar, o comportamento de nossas palavras ortográficas não é sempre o mesmo. Tomemos dois exemplos:

(1) Não o vi ontem o dia inteiro.

(2) Trouxe-me a sacola errada; pedi-lhe que me trouxesse a marrom, não a branca.

A sentença (1) conteria, sem margem a dúvidas, sete palavras ortográficas; acontece que duas dessas palavras—o pronome o e o artigo definido o—possuem um comportamento ligeiramente diferente das demais. Embora sejam palavras independentes desde o ponto de vista ortográfico, fonologicamente são geralmente átonas (salvo casos raros de entonação propositalmente deslocada, que as enfatizem por algum motivo), o que quer dizer que, desde o ponto de vista fonológico, pertencem a uma unidade superior, formada com ao menos uma outra palavra. Palavras como estas são chamadas clíticos, pois seu comportamento apresenta tanto características de um item lexical pleno (e.g. uma palavra como mesa) quanto de um afixo (e.g. formas como os prefixos in- e des- e sufixos como -ar e -íssimo). Desde o ponto de vista da história da língua, um clítico pode estar passando por um processo de transformação, que o levará a abandonar completamente suas características de palavra, para tornar-se um afixo.

Clíticos embaralham nosso conceito ortográfico de palavra, pois mostram que, desde o ponto de vista da fala, itens que são considerados palavras na escrita não se comportam como palavras isoladas. Um exemplo excelente disso pode ser visto em uma piada antiga:

– Joãozinho—pergunta a professora—, dê-me quatro palavras que começam com a letra z.
– Claro—responde Joãozinho:—zóio, zovido, zunha, zoreia.

O aluno, em processo de alfabetização, não reconhece os artigos definidos os e as como itens lexicais distintos; ao fazer a divisão da cadeia de fala em palavras, acaba transformando a marcação de plural dos artigos em um prefixos ligados aos substantivos; isso é perfeitamente conforme ao conceito de clítico, especialmente no que tange sua transformação em afixo. Embora seja uma piada (se você achou graça ou não, são outros 500), é calcada na distinção entre a intuição oral do falante sobre a língua e no modo como a norma culta ensinada nas escolas interfere nessa intuição para ensinar a língua.

Passemos ao período composto em (2). A contagem automática realizada pela ferramenta conta-palavras do Microsoft Word nos dá 4 palavras na primeira oração e 9 na segunda: o primeiro pronome me (anexado por hífen ao verbo trouxe) não é contado como palavra independente, ao passo que o segundo, grafado sem hífen, entrou na conta. O conceito de palavra do processador de textos é baseado na divisão de caracteres por espaços, não em critérios morfológicos ou semânticos, e por isso o mesmo item é contado como palavra e como parte de palavra. Pronomes átonos como me são, na verdade, clíticos.

2. Substantivos compostos

Não somente os clíticos terão problemas com o método de contagem dos processadores de texto. O Word conta itens unidos por hífen como uma única palavra; assim, pé-de-moleque é uma palavra só, embora consigamos claramente reconhecer dois substantivos e uma preposição que são usados independentemente. O Aulete Digital e o Dicio.com trazem esse substantivo composto como não-hifenizado; o Priberam agrega a informação de que o substantivo era hifenizado anteriormente ao acordo ortográfico de 1990, e que ainda o é em Portugal. Afinal, Pé de moleque é uma palavra ou três?

A ortografia e a semântica não são as únicas coisas a serem levadas em conta aqui; há o aspecto fonético também. Vejamos um exemplo clássico do inglês:

(3) White House /wʌɪt.haʊs/ x white house /wʌɪt.haʊs/

O nome da residência presidencial estadunidense forma uma unidade composta, e o acento tônico recai, segundo a preferência do inglês, sobre a primeira sílaba; quando de fato estamos falando de uma casa (qualquer) pintada de branco, o acento tônico recai sobre o núcleo do sintagma nominal (o segundo item). A marcação nos mostra que White House é vista como uma unidade já constituída, ao passo que white house é um composto de dois itens combinados. Tanto semântica quanto foneticamente, teríamos uma palavra no primeiro caso, e duas no segundo (quanto à semântica de White House, veja mais abaixo a discussão sobre composicionalidade).

3. Gramaticalização

Substantivos compostos e outros tipos de agrupamento de formas nos mostram que há, sim, unidades superiores à palavra que recebem tratamento de palavras (ao menos na medida em que a palavra representa algum tipo de unidade semântica). Essas unidades, muitas vezes, estão a meio caminho para se tornarem uma única palavra em sentido pleno.

Uma expressão como a gente, por exemplo, tem valor claramente pronominal, embora, ortograficamente, ainda seja composta por duas palavras. O processo que leva palavras separadas a se fundirem e migrarem para uma classe gramatical fechada (neste caso de artigo+substantivo para pronome) se chama gramaticalização. Faria mais sentido tratar a gente como uma única palavra, mas a contagem automática dos processadores de texto não tem como levar a gramaticalização em conta.

4. Colocações & expressões idiomáticas

A língua, como venho procurando demonstrar, é formada por mais do que palavras. O falante, para usar adequadamente uma língua natural, precisa dominar desde formas mínimas, completamente desprovidas de uso independente (como os morfemas), até grandes grupos complexos tradicionalmente transmitidos (como provérbios e ditados).

Ambos os tipos de formas são históricos, ou seja, vão sendo gerados com o desenvolvimento da língua; isso quer dizer que, antes de serem formas fixas, passaram por processos de cristalização. Palavras como adjetivos, substantivos e verbos (os chamados itens lexicais plenos) podem ser criadas livremente pelos falantes; palavras como pronomes, preposições, conjunções, numerais, determinantes (as chamadas palavras gramaticais), por sua vez, passam pelo processo acima referido: a gramaticalização.

Outras coisas que um falante não pode criar por si são as colocações e as expressões idiomáticas. Colocações são expressões que estão entre a frase inteiramente original e a forma fixa, por seu alto grau de recorrência. Por exemplo: praticamente ninguém usa o adjetivo ledo (talvez você nem saiba que significa “alegre”; eu mesmo fui checar no dicionário), a menos que seja para qualificar engano. A combinação ledo engano não é propriamente um ditado popular, mas é suficientemente recorrente para ser fixa, a ponto de garantir a sobrevivência de um adjetivo pouquíssimo usado. Expressões como em primeiro lugar, fazer as malas, ir ao dentista, com unhas e dentes são exemplos de colocações.

A colocação difere do provérbio em dos pontos importantes: (1) trata-se de um sintagma (ou seja: não de um período dotado de sujeito e verbo); (2) seu significado ainda é composicional. Dizemos que o significado de uma expressão é composicional quando pode ser derivado do significado de suas partes. Assim, em uma sentença como

(4) João esqueceu as compras no carro

o significado completo deriva dos significados individuais: a função do nome próprio João, do artigo definido as, da preposição no, o significado denotativo do verbo esquecer e dos substantivos compras e carro. Em palavras como esqueceu e compras também vemos o mesmo princípio: o sufixo –eu denota “pretérito perfeito do indicativo, 3a pessoa do singular” (ou seja, quem esqueceu, e quando); o sufixo –s denota “plural”.

Por sua vez, um provérbio como

(5) Água mole em pedra dura, tanto bate até que fura

significa algo como “as pessoas alcançam seus objetivos se perseveram” ou “a insistência gera resultados”; nada disso têm a ver diretamente com os significados de substantivos como água e pedra ou dos verbos bater e furar. (Lembre-se de White House x white house: no primeiro caso, o significado “residência presidencial estadunidense” é não-composicional; no segundo, o significado é composto pela soma dos significados denotativos das partes.)

Quando traduzimos provérbios, a prática é substitui-los por provérbios da língua de chegada que tenham significado total equivalente: uma tradução literal não seria reconhecida pelo leitor da língua-meta como proverbial, e poderia mesmo fazer pouco sentido. Assim, embora o provérbio em (5) contenha 10 palavras, funciona como uma unidade, e é traduzido integralmente, sem decomposição em unidades menores.

O que essa incursão pelo conjunto de formas e processos que compõem nosso léxico nos ensina sobre tradução?

  • O conceito de palavra pertence ao senso comum mais que à lingüística. A palavra não é tão claramente definida quanto costumamos julgar. Mesmo assim, cobrar por palavra é uma prática possível—especialmente hoje em dia, pois a contagem é automática, e, portanto, pressupõe um conceito técnico e prático de palavra, calcado em caracteres e espaços, não em unidades semânticas ou morfológicas. Embora a contagem seja parcialmente inconsistente com nossos critérios semânticos, fonológicos e ortográficos, é suficientemente regular para que possa ser empregada.
  • Mesmo assim, a cobrança por palavras induz a um erro fundamental sobre a natureza tanto das línguas quanto da tradução. Não traduzimos palavras, mas textos: traduzimos baseados na inter-relação morfossintática, semântica e pragmática entre diferentes tipos de unidades lingüísticas, em diferentes estágios de estruturação e cristalização. Em última instância, não faz sentido cobrar por palavra pois não se traduz por palavra. Mas isso é assunto para um próximo texto.
É possível traduzir palavra por palavra?
A tradução palavra-por-palavra é um ideal tradutório. Mas é possível mesmo fazer isso? Em que casos?