Eremita, tenho uma dúvida há algum tempo sobre o processo de decifrar sistemas de escritas e idiomas, é o seguinte: o pesquisador pode decifrar um sistema de escrita, mas como ele consegue decifrar o idioma?
Ex: uma criança de 6 anos provavelmente saberá ler e recitar as palavras "metacognoscível" e "pusilânime", mas provavelmente não saberá o significado das mesmas. O primeiro passo de um pesquisador ao decifrar um idioma (como Champollion fez com a Pedra de Roseta) é decobrir a lógica do sistema de escrita, talvez até a gramática, mas o que eu não entendo é como ele descobre a forma como esses sinais gráficos eram pronunciados, e o significado das palavras.
E aí? Como eles fazem?
É o seguinte, a resposta vai ficar longa pra caralho. Primeiro, vou explicar como se faria sem o sistema de escrita; depois, com ele.
Começa por "depende". Ah, vou usar escrita aqui só por simplicidade, mas o certo seria isso ser feito com a fala, ok? Se o idioma tem parentes vivos, meio caminho já tá andado.
Vamos supor, por exemplo, que você queira reconstruir o proto-germânico, o idioma que deu origem:
*aos idiomas nórdicos (sueco, norueguês, islandês, dinamarquês);
*aos germânicos ocidentais (frísio, alemão, inglês, holandês);
*aos germânicos orientais (prussiano antigo e gótico).
Você faz igual DNA, vê o que os parentes vivos têm e assume que o parente morto também tinha, procurando cognatos nos idiomas... vou usar aqui só três, com uma lista ridicularmente minúscula, mas é só pra exemplo (o certo seria usar uma lista bem grande com todos os idiomas).
Alemão, Inglês, Sueco (tradução)neu, new, ny (novo)
gut, good, bra (bom)
got, god, gud (deus)
mehr, more, mer (mais)
-er, -er, -re (formador de superlativo relativo - pense em
high = "alto",
higher = "mais alto").
Claramente, as palavras acima são parecidas de um idioma pra outro. Menos "bra", que é diferente demais de good/gut pra sequer se dizer que é cognata (de mesma origem), então a gente deixa de fora.
O que a gente nota:
*As consoantes iniciais são idênticas;
*t# (# = começo/fim de palavra) no alemão corresponde a d# no inglês e no sueco;
*r se mantém nos três idiomas.
O que é comum a todos os idiomas, a gente assume que o ancestral também tinha. Então, em proto-germânico, as palavras seriam
n--, g-(d/t), g-(d/t), m-r- (com tracinhos no que é duvidoso).
Pra decidir entre d# e t#, a gente estabelece duas hipóteses concorrentes:
*Era d# no proto-germânico, e virou t# no alemão;
*Era t# no proto-germânico, e virou d# no inglês e no sueco.
Como a primeira é mais simples, a gente opta por ela. Máxima parsimônia, navalha de Ockham, etc.
Temos então
n--, g-d, g-d, m-r-.
Ok, a gente analisou as consoantes, é mais ou menos isso. E as vogais?
Aqui, cabe uma explicação sobre a diferença na escrita e na fala. Todo mundo sabe que o inglês não tem uma escrita lá muito... "decifrável", mas alguns dos problemas da escrita dele se devem a uma coisa chamada A Grande Mudança Vocálica. "New" no inglês atual é pronunciado "níw", mas no inglês antigo era "néw", conforme a escrita. Algo parecido ocorreu com o alemão "neu" pode ser pronunciado "nói" agora, mas antes era "néw" como no inglês. A fala mudou, mas a escrita continuou.
"y" em sueco é pronunciado como o "u" do francês, com "biquinho".
Vamos assumir, por máxima parsimônia, que a palavra era "new" (pronunciado como se escreve!) no proto-germânico. E que "ew" mudou, no sueco, para "y". Ótimo, primeira palavra reconstruída! *new = novo.
E por aí vai. Da mesma forma, reconstruí *gôd, *gód e *mere.
E "bra"? Pode ser empréstimo, talvez do finlandês (não é, "bom" em finlandês é "hyvä"). Ou pode ser uma autêntica palavra germânica, mas de outra fonte (dica: pensem na palavra "better").
A partir de um vocabulário básico, você vai reconstruindo também a fonologia do idioma. Sabemos que o proto-germânico tinha t, d, g, o ditongo ew, r (talvez enrrrrrolado como no espanhol? ou batido como no português?), etc. Essa fonologia deve ser
*Consistente. Se um idioma diferencia entre b/p e d/t, e tem k, provavelmente terá g também (dica: pronunciem esses pares). Se não tiver isso na reconstrução, pode haver algo errado nela.
*Previsiva. A partir de alguma palavra dela, você deve chegar em mutações simples a palavras de idiomas-filhos.
*Coerente historicamente. Dizer que uma palavra que "não segue as regras" (como "bra", no caso) foi do finlandês para o sueco é ok. Mas dizer que ela veio do japonês, por exemplo, é nonsense.
(Em off: isso explica por que ca- no português tem cognatos com che- no francês, como
cheval/cavalo. Outros idiomas não só trazem vocabulário, como também afetam quais consoantes estarão presentes, e quais mutações vão ocorrer.)
*Algumas mutações são mais prováveis que outras. O exemplo mais clássico é que consoantes entre vogais tendem a ficar mais fracas e sonoras, ao ponto de desaparecer; em compensação, em começo e fim de palavra, tendem a ficar mais fortes.
Até aqui, tudo ok?
Mas não são só idiomas-filho que devem ser considerados... idiomas-irmãos, e idiomas-sobrinhos, também.
"New" é uma reconstrução consistente com outros idiomas indo-europeus: neo (grego) é um exemplo, assim como "novo" no português.
(Vai aparecer um engraçadinho perguntando se "nove" também é cognato de "new". Sim: os indo-europeus, quando "descobriram" o nove, chamavam-o de "número novo".)
Há um efeito em cadeia interessante no conhecimento adquirido dessa forma: conhecendo suficientes "idiomas-pai", você tem boas chances de reconstruir o "idioma-avô", também. Reconstruir o proto-germânico, por exemplo, ajuda a reconstruir o proto-indo-europeu - o idioma que deu origem ao proto-germânico.
Agora, falando de escrita vs. fala ("o idioma" em si). Você faz a mesma coisa que eu fiz acima com um idioma que não foi escrito, o proto-germânico... mas você tem mais um parâmetro pra conferir se a sua reconstrução está consistente - a ortografia. A reconstrução fica muito mais rica, e plausível, a partir disso.
Por exemplo, o P do latim. Você pode sugerir que ele era pronunciado como uma série de barulhos glotalizados, ou era uma ortografia alternativa pra Q, ou algo do tipo. Mas, através dos idiomas-filho (português, francês, romeno...), você nota que aonde os romanos escreviam P, freqüentemente há P nos idiomas-filhos. E esse P é pronunciado neles de forma bastante parecida. Isso constitui dado - por parsimônia, você conclui que o P do latim era uma "oclusiva, surda, bilabial, não-aspirada" (leia-se, igual ao nosso P). Você vai fazendo isso, uma-por-uma, com as letras que você tem.
Assume-se que os falantes eram simples o suficiente para fazer o óbvio que a gente não faz: uma letra por pronúncia, uma pronúncia por letra.
Em alguns casos, vão surgir dúvidas, como o C. Era pronunciado como TS, S ou K? No italiano, a pronúncia é às vezes TS (ex: "ciao"), às vezes K (ex: "carcamano"). No português, às vezes é S (círculo), às vezes é K (casa).
Mas você nota que há alguma regularidade: em todos os idiomas neolatinos, C é pronunciado como K antes de A, O e U. Então, era assim no latim (máxima parsimônia)...
E na frente de E e I? K virar TS é uma mutação bastante comum, na presença de vogais frontais (E e I). TS virar S, também. Então, sugere-se que CE/CI era pronunciado como KE/KI em latim clássico, e com o tempo foi virando TSE/TSI no latim vulgar. E que em alguns dos lugares em que o latim vulgar era falado, TS virou S.
(No português, a fase em que TS>S é bastante conhecida, século XV. Foi quando as peçoas comessaram a confundir C com S na escrita.)
A conclusão mais simples, nesse caso, é que palavras como circulum e caelum eram pronunciadas com o C duro - kirkulum, kaylum.
DDV, respondi a sua pergunta?
Qualquer coisa, avise que eu explico, escrevi o texto tentando fugir de vocabulário lingüístico e sem usar transcrição fonética.