O uso da Multimídia na educação

Fundamentos do Som e sua digitalização

Na natureza a maior parte dos eventos que presenciamos é acompanhado de um som; por isto devemos utilizá-lo como um poderoso aliado na obtenção da atenção do estudante. “Com a capacidade do som digital, nós teremos acesso não só aos poderosos manifestos da narração, mas também às influências subliminares dos efeitos da música”

Narrações

Podemos utilizar a voz humana digitalizada para explicar um determinado conteúdo ou procedimento, ganhando com isto um poderoso aliado, pois a narração sendo altamente expressiva serve para motivar o estudante por intermédio de mensagens e, segundo Badgett, “a forma que coletamos informações é: 10% das palavras que ouvimos, 40% da forma como as palavras são ditas e 50% daquilo que vemos” (BADGETT, 1994).

Músicas

A utilização de músicas adequadas ao conteúdo específico produz interesse e impacto, pois a música ajuda a criar o clima necessário a uma maior sintonia, envolvimento e concentração, porém vale lembrar que este poderoso aliado deve ser utilizado com moderação, pois, quando aplicado em paralelo com a leitura de textos ou estudo que quadros, por exemplo, ele pode atuar como um estímulo distrativo.

Efeitos

Efeitos especiais, como por exemplo: o som de uma porta abrindo-se ou do tocar de um telefone, aumentam a atenção do usuário, pois estamos acostumados a ouvir o som correspondente ao evento que presenciamos.

Agregando-se ao computador pessoal alguns dispositivos apropriados, ele torna-se capaz de processar e emitir sinais sonoros armazenados em arquivos com estrutura adequada que podem ser do tipo: wave e midi.

MIDI

Este tipo de formato de arquivo “.MID” permite guardar as instruções geradas por instrumentos musicais eletrônicos digitais MIDI (musical instrument digital interface). “Este padrão foi desenvolvido em 1983 para permitir aos instrumentos musicais eletrônicos digitais, como por exemplo: órgãos sintetizadores e baterias eletrônicas, comunicar-se entre si e com os computadores, independentemente de suas marcas” (LINDSTROM, 1996). Diferentemente dos arquivos formato .WAV o formato .MID não é constituído por sons capturados da natureza, mas sim por instruções como: a nota musical que foi emitida, por qual instrumento, por quanto tempo, em que altura, etc. Estes dados são lidos e sintetizados – criados artificialmente pelo computador – gerando a música correspondente.

Esta tecnologia permite criar arquivos menores e que podem ser reproduzidos indefinidamente. Sua principal aplicação é na armazenagem de música.

O formato de arquivo .MID mostra todo seu potencial para reproduzir músicas instrumentais, pois seus arquivos são relativamente pequenos – quando comparados aos .WAV com a mesma qualidade – não sobrecarregando o sistema.

interaja com os ícones da imagem acima

Fundamento Físico do Som

O termo ‘som’ se refere ao fenômeno acústico obtido pela compressão e expansão, em forma de onda, das partículas de um meio físico, –o ar, por exemplo,– ele “se propaga em todas as direções como, por exemplo, as ondas que se formam quando jogamos uma pedra em um lago calmo” (LUTHER, 1995). “Quando alguma coisa move-se na atmosfera como, por exemplo, a corda de um instrumento ou nossas cordas vocais, desloca moléculas de ar” (LINDSTROM, 1996) gerando variações de pressão. Ouvimos estas variações de pressão, quando elas chegam a nossos ouvidos. “Os ouvidos humanos são um tipo de sensor ou transdutor, pois convertem as variações de pressão audíveis para um formato elétrico utilizado pelo cérebro” (LUTHER, 1995).

Segundo Lindstron (1996) os equipamentos eletrônicos que utilizamos para capturar manipular e reproduzir o som, em sua essência, assemelham-se ao ouvido humano, pois, convertem estas variações de pressão em informações elétricas.

Para gravar um som existente na natureza utilizamos um transdutor –dispositivo capaz de converter um tipo de energia em outro– para converter a energia cinética das ondas sonoras, em energia elétrica, utilizada pelos equipamentos eletrônicos. A saída deste processo são os diferentes níveis de voltagem elétrica correspondentes aos diferentes níveis de alteração de pressão. “Um microfone é um exemplo de transdutor. Os níveis de voltagem, relacionados com o sinal analógico, são depois usados para criar um padrão em uma fita magnética. Para a reprodução, o sinal da fita é lido por cabeças de reprodução, amplificado e passa para os alto-falantes. O alto-falante é outro tipo de transdutor que realiza uma conversão oposta à do microfone.” (LINDSTROM, 1996) Os alto-falantes convertem os diferentes níveis de energia elétrica novamente em energia cinética, recriando as flutuações originais de pressão do ar tornando, o som audível.

Chamamos o som eletrônico de sinal de áudio. Ele “é quantificado em um gráfico de dois eixos – voltagem que varia em função do tempo” (LUTHER, 1995) (Gráfico 1).

Um sinal de áudio também é composto por outros parâmetros: amplitude, frequência e período –ou comprimento de onda. A amplitude é a altura de som e é medida em decibéis (dB). “Quanto maior a pressão exercida pelo objeto em movimento, mais alto será o som e maior a quantidade de decibéis” (LINDSTROM, 1996). Nos sistemas eletrônicos a amplitude é a altura da onda, e “é medida pela variação máxima e mínima de voltagem do sinal de áudio” (LUTHER, 1995) (Gráfico 2).

O segundo parâmetro para um sinal de áudio é frequência. Segundo Badgett et alii. (1994) podemos imaginar a frequência como sendo a quantidade de ondas que passa por um ponto fixo em um segundo. “A maioria dos sinais de áudio varia periodicamente da voltagem positiva à negativa e retorna à positiva novamente. A velocidade com que esta periodicidade ocorre é chamada frequência, e é expressa em ciclos por segundo. A unidade de frequência –um ciclo por segundo– é chamada hertz, (Hz)” (LUTHER, 1995) (Gráfico 2). “O ouvido humano pode detectar frequências de cerca de 20Hz até cerca de 20.000Hz ou 20 kilohertz (20kHz)” (LINDSTROM, 1996). Este componente também pode ser chamado de período, ou comprimento de onda. Ele é a distância entre os picos, ou vales, adjacentes da onda. O período é inversamente proporcional à frequência –diminui quando a frequência aumenta (Gráfico 2).

WAVE

Os arquivos wave (onda –usualmente com extensão .WAV) são arquivos obtidos digitalizando sons existentes previamente gravados ou capturando sons diretamente para o computador através de dispositivos especiais, por exemplo, um microfone. “A digitalização faz a mesma coisa para o som que faz para texto ou qualquer tipo de informação. Ela converte a informação em combinações numéricas que podem ser armazenadas, recuperadas e manipuladas pelo computador” (LINDSTROM, 1996).

Segundo Lindstron (1996), durante a digitalização do sinal de áudio as alterações de seus valores elétricos são convertidas em representações numéricas por um dispositivo chamado conversor analógico para digital (ADC – analog to digital convert) – que é um firmware1. Esta representação numérica da forma da onda de áudio pode ser novamente convertida para um sinal analógico por um conversor digital para analógico (DAC – digital to analog convert) para sua reprodução. (Figura 2).

Durante o processo de digitalização do áudio o ADC digitaliza ambas dimensões do sinal de áudio (voltagem e tempo). “A escala do tempo é convertida para digital por um processo conhecido como amostragem (sampling)” (LUTHER, 1995) (Gráfico 3). Para realizar a amostragem, o ADC faz leituras instantâneas da voltagem em espaços uniformes de tempo. “A taxa de amostragem ou frequência é o número de amostras lidas por segundo” (LUTHER, 1995).

A saída deste processo é o fluxo das amostras correspondentes à posição do sinal de áudio no momento da amostragem. Segundo Luther “podemos imaginar as amostras como instantâneos, porque cada um é o retrato exato da voltagem do sinal de áudio analógico que existia no momento da amostragem. Neste instante as amostras são convertidas em valores digitais num processo chamado quantization (Gráfico 4). A escala da voltagem é dividida por um número de níveis ou largura de banda – o número exato de níveis depende do número de bits determinado para cada amostra. Por exemplo, se forem usados 8 bits para representar cada amostra, então a escala terá 256 níveis (256=28)” (LUTHER, 1995).

Por exemplo: a saída do processo de digitalização do sinal de áudio demonstrado no acima, em uma largura de banda de 4 bits –16 níveis (16=24)– com a taxa de amostragem vista no gráfico 3, seria o seguinte fluxo de bits: 00110110101011011110110110010101001
00010010010001100111011101011.

O emprego desta tecnologia permite utilizar sons nos programas multimídia na forma de: narrações, músicas, efeitos especiais, etc.

O ouvido humano é capaz de detectar frequências que estão compreendidas na faixa entre 20Hz e 20.000Hz (ou 20kHz).

Os sons que chamamos de ‘agudos’ são os sons de maior frequência (maior número de ciclos por segundo (Hz2)) – ou cujo período é menor.

Uma boa técnica de se determinar a taxa de amostra mais adequada é a de se utilizar uma taxa que seja o dobro da frequência do som capturado. Por exemplo:

Fonte de ÁudioFrequênciaTaxa de Amostragem
Discurso2 – 4 kHz4.000 – 8.000 Hz
Sons Graves5 kHz11.025 Hz
Sons Agudos11 kHz22.050 Hz
Música11 – 20 kHz22.050 – 44.100 Hz

O sistema auditivo humano evoluiu de forma a perceber em qual direção o som foi emitido, provavelmente para dar uma vantagem na caça, ou na fuga! Este fenômeno ocorre em virtude de possuir-mos um par de ouvidos colocadas em regiões opostas da cabeça. Esta característica permite que o som chegue primeiro ao ouvido mais próximo da fonte emissora do som e, alguns milisegundos, depois no ouvido mais distante. A mente, então, calcula a posição do objeto em função deste hiato.

Faça uma experiência, fique parado, na calçada, com a face voltada para a rua e com os olhos fechados. Perceba em qual direção trafegam os automóveis.

O sistema de som estéreo permite reproduzir a diferença de tempo que leva para o som chegar aos ouvidos. Ele possui dois canais de som (direito –RC e esquerdo –LC) que emitem o som com uma pequena defasagem temporal, criando o efeito que discutimos acima.

Ocorre que tal benefício traz um custo muito elevado, pois o som digitalizado em estéreo ocupa o dobro do espaço em disco que o som digitalizado em mono. Por regra, devemos utilizar o som estéreo exclusivamente quando queremos dar, ao ouvinte, a impressão que o som vem de um local determinado do espaço.

Tamanho de arquivos de áudio

Tamanho da amostraTaxa de amostragemCanaisTamanho do arquivo
8 bits11.025 hz1 (mono)11 kbytes/s
8 bits11.025 hz2 (stereo)22 kbytes/s
8 bits22.050 hz1 (mono)22 kbytes/s
8 bits22.050 hz2 (stereo)44 kbytes/s
8 bits44.100 hz1 (mono)44 kbytes/s
8 bits44.100 hz2 (stereo)88 kbytes/s
16 bits11.025 hz1 (mono)22 kbytes/s
16 bits11.025 hz2 (stereo)44 kbytes/s
16 bits22.050 hz1 (mono)44 kbytes/s
16 bits22.050 hz2 (stereo)88 kbytes/s
16 bits44.100 hz1 (mono)88 kbytes/s
16 bits44.100 hz2 (stereo)176 kbytes/s

Seleção de parâmetros de áudio

PropósitoTamanho da amostraTaxa de amostragemCanaisTamanho do arquivo
Narração inteligível (telefone)8 bits 11.025 hz 1 (mono)11 kbytes/s
Narração de qualidade16 bits 11.025 hz 1 (mono)22 kbytes/s
Narração qualidade rádio8 bits22.050 hz 1 (mono)22 kbytes/s
Música (mono)16 bits22.050 hz 1 (mono)44 kbytes/s
Música (stereo)16 bits22.050 hz2 (stereo)88 kbytes/s
Música qualidade de CD16 bits44.100 hz2 (stereo)176 kbytes/s
Narração (ADPMC)8 bits 11.025 hz 1 (mono)5,5kbytes/s
Música (ADPMC)8 bits22.050 hz2 (stereo)22 kbytes/s

Compactação do arquivo de áudio

A compactação de arquivos de áudio é uma das tecnologias mais pesquisadas e desenvolvidas, pois suas aplicações comerciais extrapolam a informática, a exemplo da telefonia ou dos aparelhos de áudio no formato MP3.

Uma das possibilidades para a compactação deste tipo de arquivo está em se transformar as coordenadas, dos valores da amostra, de absoluta para incremental, já que a amplitude do sinal de áudio raramente sobe abruptamente.

Operações básicas para edição de som:

  • Trimming:
    • remove espaço em branco do início da gravação e no seu final
      • no menu edição os comandos mais comuns são: Cut, Clear, Erase ou Silence
  • Splicing and Assembly:
    • remove de barulhos estranhos
  • Volume Adjustments:
    • mantém o volume consistente dentro de toda a gravação
      • não utilizar volumes muito altos, pode distorcer o som
  • Format Conversion:
    • converte o formato do arquivo de áudio
      • Macintosh os formatos são SND e AIF
      • Windows é .WAV
  • Resampling ou Dowsampling:
    • economia de espaço em disco quando se utiliza baixas frequências
  • Fade-Ins e Fades-Outs:
    • suaviza o início ou fim de um som
  • Equalization:
    • modifica a frequência de gravação para tornar o som mais brilhante ou não
  • Time Stretching:
    • permite modificar o tamanho (em tempo) do arquivo de som sem alterar a música
  • Digital Signal Procesing (DSP):
    • criação de efeitos especiais
  • Reversing Sounds:
    • reverte parte do arquivo ou todo ele

Dicas do Stefanelli

  • cuidado na seleção do som:
    • ele não vai agradar a todos os usuários;
  • Sons gratuitos ao passar ou ao clicar o mouse:
    • cansam o usuário;
    • são estímulos distrativos;
  • coloque um botão que permita desligar o som;
  • os arquivos .MID geralmente são muito menores que os .WAV;
  • música de fundo em programas educativos ou informativos:
    • requer recursos do sistema;
    • são estímulos distrativos.

Percepção

  • Estímulo do Objeto
    • incitação e sensação
    • interpretação
    • conscientização
    • reação

Ciência do Som

  • Ciência do Som
    • percepção
    • física
    • tecnológica
    • terapêutica

Atributos do Som

  • Som
    • altura
      • agudo
      • médio
      • grave
    • duração
      • curto
      • longo
    • intensidade
      • forte
      • fraco
    • timbre
      • as cores do som

Som

  • captação

    • ouvir
    • perceber
    • gravar
    • digitalizar
  • sonorização
    • cantar
    • bater
    • dedilhar
    • raspar
    • executar
  • efeitos
    • físicos
      • pulsar
      • aconchegar
      • rebelar
    • psicológicos
      • seduzir
      • assustar
    • hipnotizar

Este texto possui uma apresentação para suporte ao desempenho do professor para facilitar a aquisição dos seus conteúdos
Apresentação: Fundamentos do som digita

Eduardo J. Stefanelli - www.stefanelli.eng.br