Na natureza a maior parte dos eventos que presenciamos é acompanhado de um som; por isto devemos utilizá-lo como um poderoso aliado na obtenção da atenção do estudante. “Com a capacidade do som digital, nós teremos acesso não só aos poderosos manifestos da narração, mas também às influências subliminares dos efeitos da música”
Podemos utilizar a voz humana digitalizada para explicar um determinado conteúdo ou procedimento, ganhando com isto um poderoso aliado, pois a narração sendo altamente expressiva serve para motivar o estudante por intermédio de mensagens e, segundo Badgett, “a forma que coletamos informações é: 10% das palavras que ouvimos, 40% da forma como as palavras são ditas e 50% daquilo que vemos” (BADGETT, 1994).
A utilização de músicas adequadas ao conteúdo específico produz interesse e impacto, pois a música ajuda a criar o clima necessário a uma maior sintonia, envolvimento e concentração, porém vale lembrar que este poderoso aliado deve ser utilizado com moderação, pois, quando aplicado em paralelo com a leitura de textos ou estudo que quadros, por exemplo, ele pode atuar como um estímulo distrativo.
Efeitos especiais, como por exemplo: o som de uma porta abrindo-se ou do tocar de um telefone, aumentam a atenção do usuário, pois estamos acostumados a ouvir o som correspondente ao evento que presenciamos.
Agregando-se ao computador pessoal alguns dispositivos apropriados, ele torna-se capaz de processar e emitir sinais sonoros armazenados em arquivos com estrutura adequada que podem ser do tipo: wave e midi.
Este tipo de formato de arquivo “.MID” permite guardar as instruções geradas por instrumentos musicais eletrônicos digitais MIDI (musical instrument digital interface). “Este padrão foi desenvolvido em 1983 para permitir aos instrumentos musicais eletrônicos digitais, como por exemplo: órgãos sintetizadores e baterias eletrônicas, comunicar-se entre si e com os computadores, independentemente de suas marcas” (LINDSTROM, 1996). Diferentemente dos arquivos formato .WAV o formato .MID não é constituído por sons capturados da natureza, mas sim por instruções como: a nota musical que foi emitida, por qual instrumento, por quanto tempo, em que altura, etc. Estes dados são lidos e sintetizados – criados artificialmente pelo computador – gerando a música correspondente.
Esta tecnologia permite criar arquivos menores e que podem ser reproduzidos indefinidamente. Sua principal aplicação é na armazenagem de música.
O formato de arquivo .MID mostra todo seu potencial para reproduzir músicas instrumentais, pois seus arquivos são relativamente pequenos – quando comparados aos .WAV com a mesma qualidade – não sobrecarregando o sistema.
O termo ‘som’ se refere ao fenômeno acústico obtido pela compressão e expansão, em forma de onda, das partículas de um meio físico, –o ar, por exemplo,– ele “se propaga em todas as direções como, por exemplo, as ondas que se formam quando jogamos uma pedra em um lago calmo” (LUTHER, 1995). “Quando alguma coisa move-se na atmosfera como, por exemplo, a corda de um instrumento ou nossas cordas vocais, desloca moléculas de ar” (LINDSTROM, 1996) gerando variações de pressão. Ouvimos estas variações de pressão, quando elas chegam a nossos ouvidos. “Os ouvidos humanos são um tipo de sensor ou transdutor, pois convertem as variações de pressão audíveis para um formato elétrico utilizado pelo cérebro” (LUTHER, 1995).
Segundo Lindstron (1996) os equipamentos eletrônicos que utilizamos para capturar manipular e reproduzir o som, em sua essência, assemelham-se ao ouvido humano, pois, convertem estas variações de pressão em informações elétricas.
Para gravar um som existente na natureza utilizamos um transdutor –dispositivo capaz de converter um tipo de energia em outro– para converter a energia cinética das ondas sonoras, em energia elétrica, utilizada pelos equipamentos eletrônicos. A saída deste processo são os diferentes níveis de voltagem elétrica correspondentes aos diferentes níveis de alteração de pressão. “Um microfone é um exemplo de transdutor. Os níveis de voltagem, relacionados com o sinal analógico, são depois usados para criar um padrão em uma fita magnética. Para a reprodução, o sinal da fita é lido por cabeças de reprodução, amplificado e passa para os alto-falantes. O alto-falante é outro tipo de transdutor que realiza uma conversão oposta à do microfone.” (LINDSTROM, 1996) Os alto-falantes convertem os diferentes níveis de energia elétrica novamente em energia cinética, recriando as flutuações originais de pressão do ar tornando, o som audível.
Chamamos o som eletrônico de sinal de áudio. Ele “é quantificado em um gráfico de dois eixos – voltagem que varia em função do tempo” (LUTHER, 1995) (Gráfico 1).
Um sinal de áudio também é composto por outros parâmetros: amplitude, freqüência e período –ou comprimento de onda. A amplitude é a altura de som e é medida em decibéis (dB). “Quanto maior a pressão exercida pelo objeto em movimento, mais alto será o som e maior a quantidade de decibéis” (LINDSTROM, 1996). Nos sistemas eletrônicos a amplitude é a altura da onda, e “é medida pela variação máxima e mínima de voltagem do sinal de áudio” (LUTHER, 1995) (Gráfico 2).
O segundo parâmetro para um sinal de áudio é freqüência. Segundo Badgett et alii. (1994) podemos imaginar a freqüência como sendo a quantidade de ondas que passa por um ponto fixo em um segundo. “A maioria dos sinais de áudio varia periodicamente da voltagem positiva à negativa e retorna à positiva novamente. A velocidade com que esta periodicidade ocorre é chamada freqüência, e é expressa em ciclos por segundo. A unidade de freqüência –um ciclo por segundo– é chamada hertz, (Hz)” (LUTHER, 1995) (Gráfico 2). “O ouvido humano pode detectar freqüências de cerca de 20Hz até cerca de 20.000Hz ou 20 kilohertz (20kHz)” (LINDSTROM, 1996). Este componente também pode ser chamado de período, ou comprimento de onda. Ele é a distância entre os picos, ou vales, adjacentes da onda. O período é inversamente proporcional à freqüência –diminui quando a freqüência aumenta (Gráfico 2).
Os arquivos wave (onda –usualmente com extensão .WAV) são arquivos obtidos digitalizando sons existentes previamente gravados ou capturando sons diretamente para o computador através de dispositivos especiais, por exemplo, um microfone. “A digitalização faz a mesma coisa para o som que faz para texto ou qualquer tipo de informação. Ela converte a informação em combinações numéricas que podem ser armazenadas, recuperadas e manipuladas pelo computador” (LINDSTROM, 1996).
Segundo Lindstron (1996), durante a digitalização do sinal de áudio as alterações de seus valores elétricos são convertidas em representações numéricas por um dispositivo chamado conversor analógico para digital (ADC – analog to digital convert) – que é um firmware1. Esta representação numérica da forma da onda de áudio pode ser novamente convertida para um sinal analógico por um conversor digital para analógico (DAC – digital to analog convert) para sua reprodução. (Figura 2).
Durante o processo de digitalização do áudio o ADC digitaliza ambas dimensões do sinal de áudio (voltagem e tempo). “A escala do tempo é convertida para digital por um processo conhecido como amostragem (sampling)” (LUTHER, 1995) (Gráfico 3). Para realizar a amostragem, o ADC faz leituras instantâneas da voltagem em espaços uniformes de tempo. “A taxa de amostragem ou freqüência é o número de amostras lidas por segundo” (LUTHER, 1995).
A saída deste processo é o fluxo das amostras correspondentes à posição do sinal de áudio no momento da amostragem. Segundo Luther “podemos imaginar as amostras como instantâneos, porque cada um é o retrato exato da voltagem do sinal de áudio analógico que existia no momento da amostragem. Neste instante as amostras são convertidas em valores digitais num processo chamado quantization (Gráfico 4). A escala da voltagem é dividida por um número de níveis ou largura de banda – o número exato de níveis depende do número de bits determinado para cada amostra. Por exemplo, se forem usados 8 bits para representar cada amostra, então a escala terá 256 níveis (256=28)” (LUTHER, 1995).
Por exemplo: a saída do processo de digitalização do sinal de áudio demonstrado no acima, em uma largura de banda de 4 bits –16 níveis (16=24)– com a taxa de amostragem vista no gráfico 3, seria o seguinte fluxo de bits: 00110110101011011110110110010101001
00010010010001100111011101011.
O emprego desta tecnologia permite utilizar sons nos programas multimídia na forma de: narrações, músicas, efeitos especiais, etc.
O ouvido humano é capaz de detectar freqüências que estão compreendidas na faixa entre 20Hz e 20.000Hz (ou 20kHz).
Os sons que chamamos de ‘agudos’ são os sons de maior freqüência (maior número de ciclos por segundo (Hz2)) – ou cujo período é menor.
Uma boa técnica de se determinar a taxa de amostra mais adequada é a de se utilizar uma taxa que seja o dobro da freqüência do som capturado. Por exemplo:
| Fonte de Áudio | Freqüência | Taxa de Amostragem |
| Discurso | 2 – 4 kHz | 4.000 – 8.000 Hz |
| Sons Graves | 5 kHz | 11.025 Hz |
| Sons Agudos | 11 kHz | 22.050 Hz |
| Música | 11 – 20 kHz | 22.050 – 44.100 Hz |
O sistema auditivo humano evoluiu de forma a perceber em qual direção o som foi emitido, provavelmente para dar uma vantagem na caça, ou na fuga! Este fenômeno ocorre em virtude de possuir-mos um par de ouvidos colocadas em regiões opostas da cabeça. Esta característica permite que o som chegue primeiro ao ouvido mais próximo da fonte emissora do som e, alguns milisegundos, depois no ouvido mais distante. A mente, então, calcula a posição do objeto em função deste hiato.
Faça uma experiência, fique parado, na calçada, com a face voltada para a rua e com os olhos fechados. Perceba em qual direção trafegam os automóveis.
O sistema de som estéreo permite reproduzir a diferença de tempo que leva para o som chegar aos ouvidos. Ele possui dois canais de som (direito –RC e esquerdo –LC) que emitem o som com uma pequena defasagem temporal, criando o efeito que discutimos acima.
Ocorre que tal benefício traz um custo muito elevado, pois o som digitalizado em estéreo ocupa o dobro do espaço em disco que o som digitalizado em mono. Por regra, devemos utilizar o som estéreo exclusivamente quando queremos dar, ao ouvinte, a impressão que o som vem de um local determinado do espaço.
| Tamanho da amostra | Taxa de amostragem | Canais | Tamanho do arquivo |
| 8 bits | 11.025 hz | 1 (mono) | 11 kbytes/s |
| 8 bits | 11.025 hz | 2 (stereo) | 22 kbytes/s |
| 8 bits | 22.050 hz | 1 (mono) | 22 kbytes/s |
| 8 bits | 22.050 hz | 2 (stereo) | 44 kbytes/s |
| 8 bits | 44.100 hz | 1 (mono) | 44 kbytes/s |
| 8 bits | 44.100 hz | 2 (stereo) | 88 kbytes/s |
| 16 bits | 11.025 hz | 1 (mono) | 22 kbytes/s |
| 16 bits | 11.025 hz | 2 (stereo) | 44 kbytes/s |
| 16 bits | 22.050 hz | 1 (mono) | 44 kbytes/s |
| 16 bits | 22.050 hz | 2 (stereo) | 88 kbytes/s |
| 16 bits | 44.100 hz | 1 (mono) | 88 kbytes/s |
| 16 bits | 44.100 hz | 2 (stereo) | 176 kbytes/s |
| Propósito | Tamanho da amostra | Taxa de amostragem | Canais | Tamanho do arquivo |
| Narração inteligível (telefone) | 8 bits | 11.025 hz | 1 (mono) | 11 kbytes/s |
| Narração de qualidade | 16 bits | 11.025 hz | 1 (mono) | 22 kbytes/s |
| Narração qualidade rádio | 8 bits | 22.050 hz | 1 (mono) | 22 kbytes/s |
| Música (mono) | 16 bits | 22.050 hz | 1 (mono) | 44 kbytes/s |
| Música (stereo) | 16 bits | 22.050 hz | 2 (stereo) | 88 kbytes/s |
| Música qualidade de CD | 16 bits | 44.100 hz | 2 (stereo) | 176 kbytes/s |
| Narração (ADPMC) | 8 bits | 11.025 hz | 1 (mono) | 5,5kbytes/s |
| Música (ADPMC) | 8 bits | 22.050 hz | 2 (stereo) | 22 kbytes/s |
A compactação de arquivos de áudio é uma das tecnologias mais pesquisadas e desenvolvidas, pois suas aplicações comerciais extrapolam a informática, a exemplo da telefonia ou dos aparelhos de áudio no formato MP3.
Uma das possibilidades para a compactação deste tipo de arquivo está em se transformar as coordenadas, dos valores da amostra, de absoluta para incremental, já que a amplitude do sinal de áudio raramente sobe abruptamente.
captação
Este texto possui uma apresentação para suporte ao desempenho do professor para facilitar a aquisição dos seus conteúdos
Apresentação: Fundamentos do som digita