Artigo

Compartilhe

No começo desta semana a Apple anunciou um novo produto que vinha sendo aguardado com grande expectativa no setor de sonorização e automação residencial: o alto-falante inteligente HomePod, que concorrerá com o Google Home e o Amazon Echo. Muito mais que simples alto-falantes, estes aparelhos são verdadeiros sistemas inteligentes que ficam continuamente à escuta de comandos de voz, com os quais seus usuários podem não somente controlar a reprodução de música, mas também realizar buscas na Internet, controlar luminárias e eletrodomésticos e gravar lembretes e compromissos em suas agendas, além de várias outras funções. Mesmo sendo relativamente pequenos, estes aparelhos são dotados internamente de múltiplos alto-falantes e microfones que lhes permitem auto adaptar-se às características acústicas do ambiente em que estão instalados, minimizando distorções de áudio e atingindo elevada precisão no reconhecimento dos comandos de voz, mesmo na presença de ruídos.

Há uma tecnologia-chave por trás dos avançados recursos de áudio e reconhecimento de voz dos alto-falantes inteligentes. Esta tecnologia também está presente no formato JPEG das suas fotos digitais, no formato MP3 dos seus arquivos de música, nos discos Blu-ray, na TV digital e nos serviços de streaming de áudio e vídeo. E mais: nos exames médicos de ultrassom, tomografia computadorizada e ressonância magnética; nas redes de telefonia celular, banda larga e Wi-Fi. Sabe o que todas estas tecnologias e muitas outras tão presentes no nosso dia a dia têm em comum? Todas elas empregam o Processamento Digital de Sinais — PDS (ou Tratamento Numérico de Sinais, como preferem os franceses). Trata-se de um ramo da engenharia eletrônica que consiste em usar computadores ou outros processadores digitais para realizar operações, tipicamente de natureza matemática, sobre medições de grandezas físicas — em geral variantes no tempo e/ou no espaço — tais como a pressão acústica de sons, a energia luminosa emitida por uma cena ou a diferença de potencial elétrico entre dois pontos da pele gerada pelos batimentos cardíacos, para dar alguns exemplos de sinais. No entanto, técnicas de PDS também podem ser aplicadas a sequências numéricas não resultantes de digitalização de sinais analógicos, como, por exemplo, cotações do mercado financeiro.

Quando menos é mais

Aplicado a áudio, imagens e vídeo, o PDS frequentemente tem como objetivo comprimir os sinais, para que possam ser armazenados ou transmitidos de forma mais eficiente. Técnicas de compressão de dados que exploram apenas a redundância estatística, sem usar o PDS, tipicamente conseguem reduzir o volume de dados destes sinais em cerca de 25% (A compactação estatística é mais eficiente para outros tipos de dados, como arquivos de documentos, por exemplo, que podem ser reduzidos a até 10% do tamanho original ou ainda menos, dependendo do seu conteúdo). Tais técnicas permitem recuperar exatamente os sinais originais, sem perdas, porém preservam informações que, muitas vezes, não são relevantes para a qualidade subjetiva do sinal reconstruído. Por sua vez, as técnicas de compressão baseadas em PDS (mais corretamente ditas técnicas de codificação) utilizam modelos matemáticos dos sistemas auditivo e visual humanos para determinar quais componentes dos sinais são menos perceptíveis e podem ser descartados sem grande prejuízo da qualidade do sinal reconstruído, obtendo assim uma redução muito maior no volume de dados.

Para exemplificar o ganho de desempenho proporcionado pelo PDS, podemos considerar os arquivos de imagem de uma câmera digital de, digamos, 20 megapixels, com sensor de 12 bits (ou 1,5 byte) por pixel. Um arquivo no formato chamado RAW, contendo os dados brutos de uma imagem, sem compressão, tem então o tamanho de 30 megabytes (ou um pouco mais, devido aos metadados – informações adicionais salvas no arquivo juntamente com a imagem). Note que o arquivo terá 30 e não 90 megabytes, pois os sensores das câmeras digitais geralmente registram em cada pixel apenas um dos componentes nas cores vermelha, verde ou azul, sendo os outros dois componentes obtidos posteriormente por uma técnica de interpolação denominada demosaicing. Se convertido para um formato de compressão estatística, como o ZIP, o tamanho do arquivo tipicamente será reduzido para cerca de 20 a 25 megabytes, dependendo da cena fotografada. Já se for convertido para o formato JPEG, um formato de codificação baseado em PDS, o tamanho tipicamente será reduzido a de 3 a 6 megabytes, dependendo da qualidade desejada para a imagem após a descompressão (ou decodificação). Desta forma, será possível armazenar no cartão de memória da câmera, em média, de cinco a dez vezes mais imagens em formato JPEG do que no formato RAW ou de quatro a oito vezes mais do que no formato ZIP.

Atualmente, o fator de redução no volume de dados obtido para sinais de áudio por codificadores baseados em PDS, como o conhecido MP3 ou o AAC, também pode chegar a 10:1. Já para sinais de vídeo, é possível obter reduções ainda maiores, como a da ordem de até 100:1 proporcionada pelo codificador denominado H.264 usado no padrão brasileiro de TV digital. Estes fatores de compressão tendem a aumentar ainda mais à medida em que as técnicas de codificação de sinais vão evoluindo.

Uma verdadeira revolução na medicina

Na área de saúde, o PDS permitiu o desenvolvimento de equipamentos eletromédicos para realização de exames hoje considerados essenciais, sobretudo os usados no diagnóstico assistido por imagens. O princípio comum a vários destes equipamentos é o de usar as informações parciais contidas em sinais uni- ou bidimensionais para compor sinais de dimensões superiores. Na tomografia computadorizada, por exemplo, sinais radiográficos captados por sensores unidimensionais dispostos em volta do corpo do paciente são combinados por meio de técnicas de PDS para formar um sinal bidimensional (imagem) que representa a densidade dos tecidos em uma seção transversal da parte do corpo que está sendo examinada, permitindo a visualização de órgãos e a detecção de tumores e outras anomalias de forma não-invasiva. Desenvolvida nas décadas de 1960 e 1970, esta tecnologia mostrou-se tão revolucionária que conquistou para os seus inventores o prêmio Nobel de medicina de 1979. Posteriormente, uma tecnologia semelhante permitiu o desenvolvimento dos aparelhos de ressonância magnética, que utilizam campos magnéticos e ondas de rádio em lugar dos raios-X usados na tomografia computadorizada. Além destas, há muitas outras aplicações médicas do PDS, como em radiografia digital, ultrassonografia, eletrocardio/encéfalo/miografia digital, aparelhos auditivos e telemedicina, para citar apenas alguns exemplos.

Transmitindo informação com mais eficiência

O PDS também desempenha um papel fundamental nas modernas tecnologias de comunicação. Nesta área, o foco está em utilizar da maneira mais eficiente possível a capacidade de transmitir informação do canal de comunicação empregado, além de proporcionar uma maior imunidade a ruídos e outras distorções introduzidas pelo canal. Algumas operações de PDS tipicamente encontradas em sistemas de comunicação são a geração de formas de onda, modulação e demodulação, sincronização, filtragem, equalização e cancelamento de eco. Como um exemplo dos ganhos proporcionados pelo PDS em sistemas de comunicação, podemos comparar a largura de banda de uma única estação de rádio FM analógica, igual a 200 kHz, com a de um canal de rádio digital no padrão DAB+, que permite combinar até 9 canais de 128 kbps em uma única banda com largura de 1,5 MHz, resultando em uma média de 166 kHz por canal, ou cerca de 20% mais canais por MHz. No entanto, este ganho torna-se bem mais expressivo quando se leva em conta o efeito da interferência cruzada, que limita o número de canais que podem ser usados em uma mesma região geográfica. Por ser a transmissão digital menos suscetível a este tipo de interferência, a largura de banda necessária para transmissão de um determinado número de canais DAB+ em uma dada região geográfica pode ser até 6 vezes menor que a largura de banda necessária para o mesmo número de canais de rádio FM analógica, liberando porções do espectro eletromagnético para outras aplicações.

Em uma série de próximas postagens aqui no Blog da CERTI abordaremos várias aplicações do Processamento Digital de Sinais, mostrando como esta área de competência da CERTI pode ser usada para desenvolver produtos e soluções inovadores para nossos clientes. Na agricultura de precisão, por exemplo, veremos como o processamento de imagens multiespectrais coletadas por meio de drones pode permitir ganhos de produtividade. Na automação industrial, consideraremos como o uso de PDS em sistemas ciberfísicos contribui para o desenvolvimento da Indústria 4.0. Na área de segurança, exploraremos aplicações em biometria, incluindo reconhecimento facial, e várias outras. Assine a newsletter e acompanhe a CERTI!

Pesquisador - Engenheiro Eletricista

certi@certi.org.br

Artigos Relacionados

12 de dezembro, 2017/ Produtos e Sistemas

Tecnologia aberta e nacional: Conheça a CERTI NIO

Temos falado aqui no blog sobre tecnologia aberta e nacional sob diversos ângulos. No post “Desenvolvimento de hardware para plataformas IoT no Brasil” comentamos o quanto pode ser interessante [...]

30 de novembro, 2017/ Produtos e Sistemas

O futuro do desenvolvimento para IoT: quanto menor, melhor

O futuro do desenvolvimento para IoT depende muito do tamanho físico dos equipamentos eletrônicos. Quem trabalha com desenvolvimento eletroeletrônico sabe que, de um modo geral, existe uma [...]

23 de novembro, 2017/ Produtos e Sistemas

5 passos para escolher a tecnologia ideal para o desenvolvimento de IoT

No texto anterior falamos sobre o “Desenvolvimentos de hardware para plataformas IoT no Brasil”. Nele explicamos como o governo brasileiro tem se preparado para incentivar iniciativas [...]