Autor Tópico: Lingüística  (Lida 69047 vezes)

0 Membros e 1 Visitante estão vendo este tópico.

Offline Dodo

  • Nível Máximo
  • *
  • Mensagens: 5.304
Re: Lingüística
« Resposta #250 Online: 07 de Dezembro de 2010, 13:41:06 »
Sobre o texto do angolanos: parece minha filha conversando no MSN.
Você é único, assim como todos os outros.
Alfred E. Newman

Offline uiliníli

  • Nível Máximo
  • *
  • Mensagens: 18.107
  • Sexo: Masculino
Re: Lingüística
« Resposta #251 Online: 07 de Dezembro de 2010, 14:12:31 »
Sobre o texto do angolanos: parece minha filha conversando no MSN.

Eu também escreveria assim se tivesse um pai bisbilhoteiro :P

Offline Fernando Silva

  • Conselheiros
  • Nível Máximo
  • *
  • Mensagens: 7.505
Re: Lingüística
« Resposta #252 Online: 10 de Janeiro de 2011, 07:27:00 »
Do livro "Speak - a short history of languages" - por Tore Janson
Citar
In their details languages differ greatly, as is well known. It is
not true that all languages are equally dificult at all levels, a fact
easy to observe by any language learner. For example, the
English language has a highly elaborated system of vowels and
diphthongs, while Spanish has only five basic vowels.

On the other hand, the verbs in Spanish have many more forms
than the verbs in English. Any attempt to make a comprehensive
assessment of the dificulty or the "development" of these two
languages would entail a decision about whether vowels contribute
more to dificulty than verb forms, or vice versa.

It is very hard to find criteria for such decisions. In their
totality, both languages are highly complex and very dif?cult
to master. This does not necessarily mean that all languages
are at exactly the same level when it comes to dificulty or
development in this sense, but it is hard to find major differences.

   The Khoisan languages all have very complex sound systems.
They have more vowels and many more consonants than is
found in any European language. This is partly because all these
languages have special consonants, called clicks; they are used as
speech sounds only in southern Africa. In addition, they use
more consonants than we do even if the clicks are not counted.

One Khoisan language, called !Xóõ, has a larger number of
speech sounds than any other known language. There are more
than a hundred distinctive sounds, as compared with thirty or
forty in most other languages.

On the other hand, both in !Xóõ and in many other Khoisan
languages the number of different forms for each verb is small,
and the rules for sentence formation are mostly simple.
So those language systems are dificult as far as the sounds are
concerned, but fairly simple in other ways.

   This is not true for languages used among gatherers and
hunters in other parts of the world. The Australian Aborigines
spoke many different languages when the Europeans arrived.

Most of these are very simple as far as the sound systems are
concerned. Several of them have less than twenty distinctive
sounds, which is about as low as is reported for any human lan-
guage. But their systems for inflecting words are very advanced,
so that one single complex verb may sometimes express a mean-
ing that has to be rendered by several clauses in English.

An example from the Australian language Rembarrnga is yarran-
m??-ku?pi-popna-ni-yuwa. This form with six components is to
be understood, according to the leading authority, R. M. W.
Dixon, as "it [the kangaroo] might smell our sweat as we try to
sneak up on it." So the Australian languages are simple when it
comes to sounds, but dificult at other levels.

  This shows that languages in cultures of gatherers and
hunters are just like other languages in terms of sounds and
grammar: they are simple in some ways, and complex in others,
just like English or Spanish or Arabic.

As far as the language systems are concerned, the languages
we speak are fully comparable with the languages spoken among
gatherers and hunters of today, and presumably with those spoken
by our ancestors when they were gatherers and hunters.
 
On average, languages do not become more or less complex. They just vary.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #253 Online: 28 de Janeiro de 2011, 03:50:44 »
finlandes é parente do Hungaro. É uma lingua fino-hugrica.
E há quem considere que as duas são parentes distantes do turco.

Sério?!

Bom, olhando a classificação das línguas feitas pela Linguística, isso soa muito absurdo.

O turco é da família Macro-Altáica, a mesma do japonês e coreano! Tem origem nos povos mongóis.
Maaaaaaaaaais ou menos, DDV. A família altaica por si só já é controversa. A macro-altaica [altaica + agregados], então, nem se fala.

Família macro altaica é aceita só por alguns... e tem opositores ferrenhos.
Mesmo o altaico, o maior ramo dessa família hipotética, ainda gera briga após briga.

O que a gente sabe com razoável certeza:
*Turco, uigur e uma língua siberiana que não lembro o nome são parentes próximos [línguas túrquicas];
*Línguas mongóis provavelmente são parentes das túrquicas;
*Meia dúzia de línguas da Mongólia e da Sibéria são aparentadas entre si, e provavelmente com as túrquicas e mongólicas.

Esse é o altaico "basicão", noto que no meio acadêmico pouca gente discute disso...
A grande briga é sobre:
*Coreano é altaico?
*Japonês é altaico? [acredito que sim - comparem as vogais do japonês antigo com as do turco e etc.]

De resto, é só confusão... a gente [indo-europeus] ao menos teve o luxo de atestados escritos de três idiomas antiquíssimos [latim, grego, sânscrito] pra ajudar na reconstrução.
Altaicos, não.

Então [indo ao ponto]: tanto quem diz que o macro-altaico existe como quem diz que não existe tá sendo meio irresponsável.

A escrita cuneifome era tao boa assim?

Até os hititas usaram
É legalzinha, se você escreve em placas de barro cru... o meio de escrita acaba condicionando a escrita, e sistemas que não se adequam aos novos meios são deixados pra trás.



Fernando Silva, o texto é interessante, mas o uso de angolismos foi beeeeeeeeem forçado... é como se pegassem um texto pra ilustrar o português do Brasil usando o paulistano de vila, ou as gírias curitibanas.



É bom estar à ativa na Lingüística de novo :D
Latebra optima insania est.

Offline Moro

  • Nível Máximo
  • *
  • Mensagens: 20.984
Re: Lingüística
« Resposta #254 Online: 28 de Janeiro de 2011, 15:28:08 »
bom mesmo... aguardando mais posts seus..
“If an ideology is peaceful, we will see its extremists and literalists as the most peaceful people on earth, that's called common sense.”

Faisal Saeed Al Mutar


"To claim that someone is not motivated by what they say is motivating them, means you know what motivates them better than they do."

Peter Boghossian

Sacred cows make the best hamburgers

I'm not convinced that faith can move mountains, but I've seen what it can do to skyscrapers."  --William Gascoyne

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #255 Online: 28 de Janeiro de 2011, 16:28:44 »
Agora vai aí um tópico que boa parte não vai entender... mas qualquer coisa, perguntem, ok?

Translit Dva

Translit Dva (Translit Dois, TD) é um sisteminha de transliteração que fiz em base do atual Translit usado para o russo. Fiz por misto de tédio e cabeça não parando de pensar, mas talvez seja útil... então, tô mostrando pra vocês.

O TD tenta ser:
*Um sistema multilingual - aplicável a russo, ucraniano e bielorrusso, mas mantenha as escritas das três diferentes entre si;
*Sem perdas - os textos podem ser transliterados e "destransliterados" livremente sem ocorrer problemas como Я > ja > ЙА ou Щ > shch > ШЧ
*Fácil de digitar, usando no máximo dígrafos (sem tetrágrafos, viu? Aliás, quem inventou a porra do "shch"???)
*Intuitivo para os falantes/escritores nativos (por isso usei o Translit como base)...

Notem, isto não é uma escrita nativa, não estou propondo substituir o cirílico ou algo assim.

Indo ao ponto... na primeira coluna, em cirílico. Na segunda, transliterado pelo TD.

________
А - a   
Б - b
В - v
Г - g
Ґ - gh
Д - d
Е - e
Ё - jo
Є - je
Ж - zh
________
З - z
І - ih
Ї - ji
И - i
Й - î
К - k
Л - l
М - m
Н - n
О - o
________
П - p
Р - r
С - s
Т - t
У - u
Ў - û
Ф - f
Х - x
Ц - c
Ч - ch
________
Ш - sh
Щ - q
Ъ - yh
Ꙑ - jy
Ь - y
Э - eh
Ю - ju
Я - ja
’ - '

Diferenças para o translit tradicional:
1. "j" e "h" são usados como diacríticos - modificam a letra anterior, mas por si só não têm nenhum valor. "j" indica principalmente vogais palatizadas, enquanto "h" indica consoantes sem letras para o alfabeto latino. No Translit, eles indicam também /j/ e /x/.
2. Щ ganhou letra própria, "q". Tava sobrando mesmo... e é melhor que "shch".
3. As semivogais são indicadas com um acento circunflexo, e não com letras próprias, imitando o uso nativo do kratkoe.

O que acham?

EDIT: pra facilitar a visualização, coloquei numa tabela. E os "j" agora precedem as vogais.
« Última modificação: 28 de Janeiro de 2011, 19:12:38 por Kajsar »
Latebra optima insania est.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #256 Online: 28 de Janeiro de 2011, 16:49:38 »
Trechinho do Guerra e Paz transliterado desse jeito só pra mostrar como fica o texto:

Так говорила в июле 1805 года известная Анна Павловна Шерер, фрейлина и приближенная  императрицы  Марии  Феодоровны,  встречая важного и  чиновного князя  Василия [...]

Tak govorila v iujle 1805 goda izvestnaaj Anna Pavlovna Sherer, freîlina i priblizhennaaj imperatricyj Marii Feodorovnyj, vstrechaaj vazhnogo i chinovnogo knajzaj Vasiliaj [...]
Latebra optima insania est.

Offline EuSouOqueSou

  • Nível 31
  • *
  • Mensagens: 1.991
  • Sexo: Masculino
  • Question not thy god, for thy god doth not respond
Re: Lingüística
« Resposta #257 Online: 28 de Janeiro de 2011, 18:22:11 »
Agora vai aí um tópico que boa parte não vai entender... mas qualquer coisa, perguntem, ok?

Translit Dva

Translit Dva (Translit Dois, TD) é um sisteminha de transliteração que fiz em base do atual Translit usado para o russo. Fiz por misto de tédio e cabeça não parando de pensar, mas talvez seja útil... então, tô mostrando pra vocês.

O TD tenta ser:
*Um sistema multilingual - aplicável a russo, ucraniano e bielorrusso, mas mantenha as escritas das três diferentes entre si;
*Sem perdas - os textos podem ser transliterados e "destransliterados" livremente sem ocorrer problemas como Я > ja > ЙА ou Щ > shch > ШЧ
*Fácil de digitar, usando no máximo dígrafos (sem tetrágrafos, viu? Aliás, quem inventou a porra do "shch"???)
*Intuitivo para os falantes/escritores nativos (por isso usei o Translit como base)...
[...]
O que acham?

Ééééé.... num intindi nada nao dotô. :P, mas dexa pra lá num pricisa ixpricá nao sinhô. :D
Qualquer sistema de pensamento pode ser racional, pois basta que as suas conclusões não contrariem as suas premissas.

Mas isto não significa que este sistema de pensamento tenha correspondência com a realidade objetiva, sendo este o motivo pelo qual o conhecimento científico ser reconhecido como a única forma do homem estudar, explicar e compreender a Natureza.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #258 Online: 28 de Janeiro de 2011, 19:06:39 »
Enjolras, é assim.
O russo e mais uma penca de idiomas usam o alfabeto cirílico: http://pt.wikipedia.org/wiki/Alfabeto_cir%C3%ADlico
Agora, imagine que você precisa digitar esse alfabeto em um teclado com alfabeto latino, ou quer colocar palavras russas em um texto em outro idioma, coisas assim...
Complica, né?

Pra isso, existe transliteração - onde você pega as letras do cirílico e usa equivalentes no latino. Só que existem N formas de transliterar um texto, algumas melhores, outras piores...
A mais usada do cirílico pro latino chama-se Translit: http://es.wikipedia.org/wiki/Translit [na falta de artigo em português, vai o espanhol mesmo]

Só que o Translit tem N problemas:
*Só é usado no russo - pra usar em outros idiomas que usam o cirílico, você precisa de outras transliterações;
*Algumas letras no cirílico têm duas ou três formas de serem transliteradas no latino pelo Translit;
*Ambigüidade - por exemplo, tanto шч como щ do mesmo jeito;
E por aí vai.

Então, eu peguei o Translit, dei umas alteradas, e coloquei aí uma transliteraçãozinha que corrige esses erros... e ainda por cima, permite transliteração automática [inclusive, tô tentando fazer um script pra isso].

Ainda vou dar umas alteradas... o "j" vai pra frente das vogais... mas coloquei aqui pra pedir opiniões, pra ver no que é possível melhorar...
Latebra optima insania est.

Offline Geotecton

  • Moderadores Globais
  • Nível Máximo
  • *
  • Mensagens: 28.345
  • Sexo: Masculino
Re: Lingüística
« Resposta #259 Online: 29 de Janeiro de 2011, 01:41:01 »
Agora vai aí um tópico que boa parte não vai entender... mas qualquer coisa, perguntem, ok?
[...]

Interessante.

Mas preciso me aprofundar mais no assunto. Muito mais.
Foto USGS

Offline EuSouOqueSou

  • Nível 31
  • *
  • Mensagens: 1.991
  • Sexo: Masculino
  • Question not thy god, for thy god doth not respond
Re: Lingüística
« Resposta #260 Online: 29 de Janeiro de 2011, 21:00:46 »
Entendi Kajsa, é como fazem com os ideogramas japoneses passando para uma lingua latina, certo?
Qualquer sistema de pensamento pode ser racional, pois basta que as suas conclusões não contrariem as suas premissas.

Mas isto não significa que este sistema de pensamento tenha correspondência com a realidade objetiva, sendo este o motivo pelo qual o conhecimento científico ser reconhecido como a única forma do homem estudar, explicar e compreender a Natureza.

Offline Fernando Silva

  • Conselheiros
  • Nível Máximo
  • *
  • Mensagens: 7.505
Re: Lingüística
« Resposta #261 Online: 30 de Janeiro de 2011, 08:04:52 »
Entendi Kajsa, é como fazem com os ideogramas japoneses passando para uma lingua latina, certo?
Sim e não, já que os ideogramas (kanji), em si, não representam sons e sim idéias.
Mas talvez se aplique às escritas hiragana e katakana, que representam sons.

Mais detalhes:
http://www.sonoo.com.br/Escritajaponesa.html

Esta página também descreve a transliteração (por assim dizer...) roomaji ou "sistema Hepburn".

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #262 Online: 30 de Janeiro de 2011, 15:36:48 »
Entendi Kajsa, é como fazem com os ideogramas japoneses passando para uma lingua latina, certo?
Troque "ideogramas" por catacana ou hiragana e sim, a idéia é a mesma.

...e sou só eu que tenho birra contra Hepburn?
Latebra optima insania est.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #263 Online: 31 de Janeiro de 2011, 02:05:28 »
Falando em Hepburn, tô bolando também uma transliteração do japonês, em base da Kunrei-Siki [a oficial - usada nas escolas e etc.].

Os objetivos dela são:
1. Marcar se a palavra estava originalmente em hiragana, catacana ou ideograma;
2. Transliteração sem perda de hiraganas e catacanas;
3. Ser coerente com os fonemas da língua japonesa.

Se alguém estiver interessado, me avise que vou postando...
Latebra optima insania est.

Offline Fernando Silva

  • Conselheiros
  • Nível Máximo
  • *
  • Mensagens: 7.505
Re: Lingüística
« Resposta #264 Online: 31 de Janeiro de 2011, 07:11:58 »
Falando em Hepburn, tô bolando também uma transliteração do japonês, em base da Kunrei-Siki [a oficial - usada nas escolas e etc.].

Os objetivos dela são:
1. Marcar se a palavra estava originalmente em hiragana, catacana ou ideograma;
2. Transliteração sem perda de hiraganas e catacanas;
3. Ser coerente com os fonemas da língua japonesa.

Se alguém estiver interessado, me avise que vou postando...
Não tem aplicação para mim, mas talvez postando aqui acabe chegando a alguém que se interesse.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #265 Online: 31 de Janeiro de 2011, 14:49:51 »
Ó, é assim. Eu tava lendo sobre a transliteração recomendada - a Kunrei-Shiki [KS] e descobri que ela é quase ótima.
A minha é em base dela, com pequenas diferenças:

*Dígrafos para sílabas palatizadas usam "j" e não "y", para facilitar silabificação;
*/n/ moraico [de fim de sílaba] é representado por "q", e não por "n" ou "n'";
*Ideogramas são marcados com um "x" mudo na transliteração;
*Seqüências originalmente em catacana são marcadas com um "c" mudo;

Tô postando aqui pra que o biscoito1r ou outros que conheçam japonês melhor que eu achem os erros, façam sugestões, etc.



Frase-exemplo: 現在、ウィキペディア日本語版には約 731,402 本の記事があります。
(Tirada da página principal da Wikipédia japonesa.)

Metodologia:

1. Adicione espaços entre as mudanças no sistema de escrita. Mais espaços são opcionais;
現在、ウィキペディア 日本語版 には 約 731,402 本 の 記事 があります。

2. Adicione um "x" após as seqüências de ideogramas e um "c" após as seqüências de catacanas;
現在x、ウィキペディアc 日本語版x には 約x 731,402 本x の 記事x があります。

3. Converta os silabários segundo a tabela abaixo. Ideogramas devem ser convertidos com seu valor de leitura normal no contexto.
geqzaix, uikipedeiac nihoqgobanx niwa yakux 731.402 honx na kizix gaarimasu.

4. Converta a pontuação.


A tabela de transliteração:

___________________________________________________________________
あ ア aい イ iう ウ uえ エ eお オ o
か カ kaき キ kiく ク kuけ ケ keこ コ koきゃ キャ kjaきゅ キュ kjuきょ キョ kjo
が ガ gaぎ ギ giぐ グ guげ ゲ geご ゴ goぎゃ ギャ gjaぎゅ ギュ gjuぎょ ギョ gjo
さ サ saし シ siす ス suせ セ seそ ソ soしゃ シャ sjaしゅ シュ sjuしょ ショ sjo
ざ ザ zaじ ジ ziず ズ zuぜ ゼ zeぞ ゾ zoじゃ ジャ zjaじゅ ジュ zjuじょ ジョ zjo
た タ taち チ tiつ ツ tuて テ teと ト toちゃ チャ tjaちゅ チュ tjuちょ チョ tjo
だ ダ daぢ ヂ diづ ヅ duで デ deど ド doぢゃ ヂャ djaぢゅ ヂュ djuぢょ ヂョ djo
な ナ naに ニ niぬ ヌ nuね ネ neの ノ noにゃ ニャ njaにゅ ニュ njuにょ ニョ njo
は ハ haひ ヒ hiふ フ huへ ヘ heほ ホ hoひゃ ヒャ hjaひゅ ヒュ hjuひょ ヒョ hjo
ば バ baび ビ biぶ ブ buべ ベ beぼ ボ boびゃ ビャ bjaびゅ ビュ bjuびょ ビョ bjo
ぱ パ paぴ ピ piぷ プ puぺ ペ peぽ ポ poぴゃ ピャ pjaぴゅ ピュ pjuぴょ ピョ pjo
ま マ maみ ミ miむ ム muめ メ meも モ moみゃ ミャ mjaみゅ ミュ mjuみょ ミョ mjo
や ヤ yaゆ ユ yuよ ヨ yo
ら ラ raり リ riる ル ruれ レ reろ ロ roりゃ リャ rjaりゅ リュ rjuりょ リョ rjo
わ ワ waゐ ヰ wiゑ ヱ weを ヲ wo
ん ン q
っ ッ - duplique a consoante posterior
ゝ ヽ / ゞヾ - copie a sílaba anterior, vozeando ou não conforme as regras "normais" do japonês
Vogais longas - acento circunflexo.
Pontuação e etc. - translitere com o mais próximo no sistema latino que você achar.

Pra quem conhece a KS, vai notar que a minha é quase igual. Vou enfatizar as diferenças...
*Dígrafos representando consoantes palatizadas usam "j" e não "y". Assim, a silabificação fica mais fácil;
*/n/ moraico é transliterado como "q" e não como "n", para evitar ambigüidades (dica: tentem transliterar きんえん e きねん para ver a diferença)



Problema: como diferencio na transliteração as versões menores dos hiraganas das vogais?
Latebra optima insania est.

Offline Barata Tenno

  • Nível Máximo
  • *
  • Mensagens: 16.283
  • Sexo: Masculino
  • Dura Lex Sed Lex !
Re: Lingüística
« Resposta #266 Online: 31 de Janeiro de 2011, 15:02:40 »
Muito bom Eremita!!!

A transliteração do /n/ principalmente achei ótima.

Como vai ser o は quando estiver como particula?
He who fights with monsters should look to it that he himself does not become a monster. And when you gaze long into an abyss the abyss also gazes into you. Friedrich Nietzsche

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #267 Online: 31 de Janeiro de 2011, 15:26:31 »
Muito bom Eremita!!!

A transliteração do /n/ principalmente achei ótima.

Como vai ser o は quando estiver como particula?
Ignore a pronúncia... translitere como "ha", mesmo. Pra falantes nativos [o enfoque principal dessa transliteração], fica perfeitamente inteligível.

E se essas minhas transliterações derem certo, vou ver se faço um script ou em Bash ou em Python pra transliteração automática.
« Última modificação: 31 de Janeiro de 2011, 15:30:36 por Kajsar »
Latebra optima insania est.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #268 Online: 01 de Fevereiro de 2011, 01:49:36 »
Aos usuários de distros GNU/Linux: fiz um scriptzinho em Bash que translitera do cirílico pro latino automaticamente.
O QUE O SCRIPT FAZ: procura por caracteres cirílicos e substitui pelos latinos. Ainda não lida com caracteres acentuados, mas lido amanhã com isso.

Se não souberem como fazer, avisem... aos que souberem, divirtam-se.

Código: [Selecionar]
#!/bin/sh
echo "Transliterador cirílico-latino, por Piast Grimani"
echo "Licença deste programa: GPL, v3"
echo "Diga-me: em que arquivo está o texto?"
read arquivo
sed -i 's/А/A/g' $arquivo
sed -i 's/Б/B/g' $arquivo
sed -i 's/В/V/g' $arquivo
sed -i 's/Г/G/g' $arquivo
sed -i 's/Ґ/GH/g' $arquivo
sed -i 's/Д/D/g' $arquivo
sed -i 's/Е/E/g' $arquivo
sed -i 's/Ё/JO/g' $arquivo
sed -i 's/Є/JE/g' $arquivo
sed -i 's/Ж/ZH/g' $arquivo
sed -i 's/З/Z/g' $arquivo
sed -i 's/І/IH/g' $arquivo
sed -i 's/Ї/JI/g' $arquivo
sed -i 's/И/I/g' $arquivo
sed -i 's/Й/Î/g' $arquivo
sed -i 's/К/K/g' $arquivo
sed -i 's/Л/L/g' $arquivo
sed -i 's/М/M/g' $arquivo
sed -i 's/Н/N/g' $arquivo
sed -i 's/О/O/g' $arquivo
sed -i 's/П/P/g' $arquivo
sed -i 's/Р/R/g' $arquivo
sed -i 's/С/S/g' $arquivo
sed -i 's/Т/T/g' $arquivo
sed -i 's/У/U/g' $arquivo
sed -i 's/Ў/Û/g' $arquivo
sed -i 's/Ф/F/g' $arquivo
sed -i 's/Х/X/g' $arquivo
sed -i 's/Ц/C/g' $arquivo
sed -i 's/Ч/CH/g' $arquivo
sed -i 's/Ш/SH/g' $arquivo
sed -i 's/Щ/Q/g' $arquivo
sed -i 's/Ъ/YH/g' $arquivo
sed -i 's/Ы/JY/g' $arquivo
sed -i 's/Ь/Y/g' $arquivo
sed -i 's/Э/EH/g' $arquivo
sed -i 's/Ю/JU/g' $arquivo
sed -i 's/Я/JA/g' $arquivo
sed -i 's/а/a/g' $arquivo
sed -i 's/б/b/g' $arquivo
sed -i 's/в/v/g' $arquivo
sed -i 's/г/g/g' $arquivo
sed -i 's/ґ/gh/g' $arquivo
sed -i 's/д/d/g' $arquivo
sed -i 's/е/e/g' $arquivo
sed -i 's/ё/jo/g' $arquivo
sed -i 's/є/je/g' $arquivo
sed -i 's/ж/zh/g' $arquivo
sed -i 's/з/z/g' $arquivo
sed -i 's/і/ih/g' $arquivo
sed -i 's/ї/ji/g' $arquivo
sed -i 's/и/i/g' $arquivo
sed -i 's/й/î/g' $arquivo
sed -i 's/к/k/g' $arquivo
sed -i 's/л/l/g' $arquivo
sed -i 's/м/m/g' $arquivo
sed -i 's/н/n/g' $arquivo
sed -i 's/о/o/g' $arquivo
sed -i 's/п/p/g' $arquivo
sed -i 's/р/r/g' $arquivo
sed -i 's/с/s/g' $arquivo
sed -i 's/т/t/g' $arquivo
sed -i 's/у/u/g' $arquivo
sed -i 's/ў/û/g' $arquivo
sed -i 's/ф/f/g' $arquivo
sed -i 's/х/x/g' $arquivo
sed -i 's/ц/c/g' $arquivo
sed -i 's/ч/ch/g' $arquivo
sed -i 's/ш/sh/g' $arquivo
sed -i 's/щ/q/g' $arquivo
sed -i 's/ъ/yh/g' $arquivo
sed -i 's/ы/jy/g' $arquivo
sed -i 's/ь/y/g' $arquivo
sed -i 's/э/eh/g' $arquivo
sed -i 's/ю/ju/g' $arquivo
sed -i 's/я/ja/g' $arquivo
sed -i 's/’/‛/g' $arquivo

Façam uma cópia do arquivo de texto que vocês forem usar como teste.
Eu usei esse livro aqui: http://az.lib.ru/t/tolstoj_lew_nikolaewich/text_0040.shtml
Funcionou perfeitamente.

Depois faço o script inverso - do latino de volta pro cirílico. E se me der na telha, faço pra Kunrei-Sanki também.
« Última modificação: 15 de Fevereiro de 2016, 16:04:05 por Geotecton »
Latebra optima insania est.

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #269 Online: 01 de Fevereiro de 2011, 17:38:20 »
Aos usuários de distros GNU/Linux: fiz um scriptzinho em Bash que translitera do cirílico pro latino automaticamente.
Agora me manquei de uma coisa. OS X também tem o Bash, não tem?
Barata, se você manjar do terminal do OS X, você pode usar esse script também, sem problema nenhum...
Latebra optima insania est.

Offline Fernando Silva

  • Conselheiros
  • Nível Máximo
  • *
  • Mensagens: 7.505
Re: Lingüística
« Resposta #270 Online: 02 de Fevereiro de 2011, 07:29:35 »
Agora me manquei de uma coisa. OS X também tem o Bash, não tem?
Barata, se você manjar do terminal do OS X, você pode usar esse script também, sem problema nenhum...
Há diferenças de nomes de dispositivos, mas o resto é quase igual.

Offline Barata Tenno

  • Nível Máximo
  • *
  • Mensagens: 16.283
  • Sexo: Masculino
  • Dura Lex Sed Lex !
Re: Lingüística
« Resposta #271 Online: 02 de Fevereiro de 2011, 20:18:28 »
Aos usuários de distros GNU/Linux: fiz um scriptzinho em Bash que translitera do cirílico pro latino automaticamente.
Agora me manquei de uma coisa. OS X também tem o Bash, não tem?
Barata, se você manjar do terminal do OS X, você pode usar esse script também, sem problema nenhum...
Ate manjo, mas cirilico não não me muito util. Quando sair pra Kunrei-Sanki eu certamente usarei.
« Última modificação: 02 de Fevereiro de 2011, 20:20:39 por Barata Tenno »
He who fights with monsters should look to it that he himself does not become a monster. And when you gaze long into an abyss the abyss also gazes into you. Friedrich Nietzsche

Offline Eremita

  • Nível 38
  • *
  • Mensagens: 3.833
  • Sexo: Masculino
  • Ecce.
Re: Lingüística
« Resposta #272 Online: 03 de Fevereiro de 2011, 01:22:49 »
Aos usuários de distros GNU/Linux: fiz um scriptzinho em Bash que translitera do cirílico pro latino automaticamente.
Agora me manquei de uma coisa. OS X também tem o Bash, não tem?
Barata, se você manjar do terminal do OS X, você pode usar esse script também, sem problema nenhum...
Ate manjo, mas cirilico não não me muito util. Quando sair pra Kunrei-Sanki eu certamente usarei.
Na verdade, comentei contigo por causa da Kunrei-Sanki, mesmo.
Latebra optima insania est.

Offline Derfel

  • Moderadores Globais
  • Nível Máximo
  • *
  • Mensagens: 8.887
  • Sexo: Masculino
Re: Lingüística
« Resposta #273 Online: 03 de Fevereiro de 2011, 16:29:30 »
De onde vem Kajsar? É uma forma de Caesar como o Kaiser em alemão? pronuncia-se "kaisar"?

Offline Mahul

  • Nível 17
  • *
  • Mensagens: 486
  • Sexo: Masculino
Re: Lingüística
« Resposta #274 Online: 03 de Fevereiro de 2011, 18:56:05 »
Esse tópico é nota 10! :ok: Parabéns ao Kajsar, Fernando Silva, DDV e aos outros participantes que estimularam um debate muito inteligente e interessante. :idea: 8-) E que continue...
Não gosto da direita porque ela é de direita e não gosto da esquerda porque ela também é de direita - Mestre Millôr

Deus seria reprovado em qualquer escola de engenharia - Paulo Francis

Só vou acreditar em socialismo no dia em que todo mundo puder morar em Ipanema - Grande Tom Jobim

 

Do NOT follow this link or you will be banned from the site!