Sim, não acho que é como se as pessoas treinassem "de propósito", apenas sendo um foco de atenção diferente que o cérebro, provavelmente inconscientemente (mas talvez reforçado conscientemente) acabou tendo.
Se em idiomas tonais as pessoas tendem a desenvolver isso naturalmente, é então uma diferença sonora que as pessoas poderiam mais raramente também aprender a diferenciar fora desse contexto. Talvez um pouco como algumas pessoas desenvolvem sinestesia, mas sem ser algo tão extraordinário. O cérebro autonomamente percebe padrões e os registra de forma "conscientemente acessível".
A própria visão a cores de não-daltônicos talvez seja algo análogo, havendo diferenças culturais na percepção de cores e inclusive a hipótese de que todos enxergavam/distinguiam menos cores em outros períodos da história, pelas cores não estarem tão arraigadas (ou tão "formalizadas") ainda na bagagem cultural.


Pessoas dessa tribo, sem olhos diferentes, tem a mesma dificuldade para distinguir as cores dos quadrados na tela que temos para distinguir esses quadrados verdes, enquanto eles tem a mesma facilidade que nós temos no outro caso para distinguir o verde diferente na segunda.
E também tem outros tipos de "surdez cerebral" para coisas musicais e sonoras, que da mesma forma devem ser déficits por diferentes padrões de atenção mental consciente e inconsciente durante períodos críticos. Eu acho que além de não ter "perfect pitch" também sou ruim em alguma outra coisa, que nem lembro o que é. E mesmo dislexia parece ser uma variação disso, mais comum em idiomas com maior ambiguidade sonora e menor correlação entre escrita e fala.