O que é a Biometria de Voz

e por que razão deve utilizá-la?

A biometria da voz é a ciência de usar a voz de uma pessoa como característica biológica identificadora única, a fim de a autenticar. Também conhecida como verificação de voz ou reconhecimento de voz, a biometria de voz permite um acesso rápido, sem fricções e altamente seguro para uma gama de casos de uso desde call centers, aplicativos móveis a chatbots, dispositivos IoT e acesso físico.

Avanços maciços nas redes neurais nos últimos 2-3 anos permitiram o desenvolvimento de algoritmos biométricos de voz que são mais rápidos, mais precisos, e podem autenticar os usuários com uma menor quantidade de fala. Na realidade, a ID R&D é agora capaz de exceder a precisão de um PIN de 4 dígitos em muitos casos de uso.

Tal como outras modalidades biométricas, a biometria de voz oferece vantagens significativas de segurança em relação aos métodos de autenticação que se baseiam em algo que se conhece (como uma senha ou resposta a uma pergunta “secreta”) ou algo que se tem (como o celular). A biometria de voz também melhora a experiência do cliente ao eliminar a frustração associada a processos de login incômodos e credenciais perdidas ou roubadas.

Vantagens da biometria de voz

null
Melhora a experiência do cliente com uma autenticação rápida e sem fricções
null
Melhora a segurança e minimiza as violações devido a senhas comprometidas, phishing, etc.
null
Reduz as ameaças através da identificação de fraudadores conhecidos
null
Identificação instantânea dos usuários e customiza a interacção
null
Libera operadores do tempo gasto na verificação dos usuários e na redefinição de senhas
null
Permite o login de forma natural para canais digitais, incluindo chatbots e assistentes virtuais
null
Pode ser utilizado como parte de um processo de autenticação de dois fatores para aumentar a segurança sem acrescentar esforço

Como funciona a Biometria da Voz?

Existem mais de 70 partes do corpo – cada uma com um tamanho e forma únicos – que contribuem para a forma como uma pessoa fala. A biometria da voz baseia-se no fato de que as características da voz humana se correlacionam fortemente com as qualidades fisiológicas de como uma pessoa cria a fala. Ao contrário de outros métodos de autenticação, a biometria de voz não depende de um segredo como a pessoa se lembrar de uma senha. Não é o que a pessoa diz que será verificado, é quem está falando.

Mais de 70 partes do corpo contribuem para a forma como uma pessoa produz a fala e cada uma dessas partes é única para ela. Os sistemas biométricos de voz funcionam através da extração das características que distinguem o discurso de uma pessoa das outras pessoas. O resultado é uma “impressão de voz” análoga a uma impressão digital. Uma impressão de voz é também chamada de “modelo de voz”.

Os sistemas de reconhecimento de voz cadastram uma pessoa conhecida através da criação de um modelo inicial, através da fusão de vários modelos criados a partir de amostras da fala dessa pessoa para maior precisão. O modelo inicial chama-se modelo de cadastro ou impressão de voz de cadastro.

Diagrama de registo biométrico para autenticação de voz.

Para verificar a identidade de uma pessoa cadastrada, o sistema de reconhecimento biométrico de voz captura uma nova amostra de voz, cria um modelo a partir da amostra e compara-o com o modelo de cadastro. Uma forte correspondência entre modelos indica que a mesma pessoa falou ambas as amostras, verificando assim a identidade da pessoa. Esta forma de utilizar o reconhecimento de voz chama-se Verificação do Orador. É uma correspondência de um para um entre o modelo de cadastro e alguém que afirma ser a pessoa cadastrada.

Diagrama de correspondência biométrica para autenticação de voz

Outra forma de utilizar o reconhecimento de voz é comparar uma amostra de voz de uma identidade desconhecida com múltiplos modelos de cadastro. O objetivo é encontrar a pessoa dentro do conjunto de modelos de cadastro. Esta forma de utilizar a biometria da voz chama-se Identificação do Orador. Há limites significativos para a precisão da identificação do orador, pelo que as empresas devem consultar um perito para compreender se um caso de uso 1 para N com voz será prático.

A utilização da biometria de voz para autenticação está crescendo em popularidade devido a melhorias na precisão, alimentadas em grande parte por avanços na IA, e expectativas crescente dos clientes para um acesso fácil e rápido à informação. As violações frequentes de dados associados à senha são outra razão para uma adoção mais ampla à medida que as empresas procuram formas de melhor proteger os dados dos clientes.

Quando se trata de precisão, não se trata apenas de manter a pessoa errada de fora. As empresas também têm de minimizar “falsas rejeições” que causam dores de cabeça aos clientes e agentes existentes. “Equal Error Rate” (EER) é o ponto em que o número de falsas aceitações e falsas rejeições é igual. É claro que o objetivo é tornar estes dois tipos de erros extremamente pequenos, idealmente não permitindo que nenhum impostor passe com apenas um número insignificante de pessoas válidas a serem rejeitadas.

Tipos de autenticação de voz

A autenticação de voz pode ser realizada utilizando o reconhecimento de voz dependente de texto ou biometria de reconhecimento de voz independente de texto.

A verificação de voz dependente do texto é quando uma pessoa fala uma frase específica, geralmente constituída por duas a três palavras, como “A minha voz é a minha senha”.
Saiba mais

A verificação de voz independente do texto é uma abordagem biométrica de voz passiva, através da qual o utilizador pode dizer qualquer coisa, permitindo que a autenticação aconteça rapidamente em segundo plano durante a sua interação normal com um agente, IVR, ou aplicação.
Saiba mais

Sobre o IDVoice

O IDVoice da ID R&D é um robusto motor biométrico de reconhecimento de voz orientado por IA que fornece tanto a verificação de voz dependente e independente de texto para canais móveis, web e telefone, bem como o acesso físico e a integração de dispositivos IoT. O produto é construído sobre uma Rede Neural Convolucional inovadora e uma abordagem x-vector modificada para a tecnologia de extração de características para uma precisão inigualável e está classificado em #1 no principal desafio de referência da indústria.

O IDVoice é independente do idioma, trabalha com frases ultra-curtas e é bastante compacto. Baixe os materiais do IDVoice ou visite as nossas páginas IDVoice Text Dependent Verification e IDVoice Text Independent Verification para saber mais.

Ameaças aos sistemas de Verificação de Voz

Embora a biometria de voz ofereça uma forma segura de autenticar os utilizadores, ela não é imune a ameaças. Os avanços na aprendizagem de máquinas, tecnologia de gravação e fala sintética permitem falsificações de voz de alta qualidade, ou “deepfakes” de voz que são capazes de enganar os seres humanos e os sistemas biométricos de voz, fazendo-os pensar que se tratar da voz de uma pessoa real. Estes ataques podem ser utilizados para obter acesso não autorizado a contas.

O combate à falsificação da voz requer tecnologia de detecção da vivacidade, capaz de distinguir entre uma voz viva e uma versão gravada, sintética ou gerada por computador da voz. Pode aprender mais sobre o anti-spoofing de voz aqui.

Quer saber mais?

Ao contrário de outras soluções, a tecnologia de autenticação de voz da ID R&D funciona em qualquer idioma sem reconfiguração, funciona através de vários canais com uma configuração de calibração, e foi concebida desde o início para ser tolerante ao ruído. Pronto para saber mais sobre as nossas soluções de autenticação de voz?

Perguntas frequentes sobre biometria de voz

Um algoritmo biométrico forte de reconhecimento de voz continuará a funcionar como esperado e com elevada precisão, mesmo que o usuário tenha uma gripe, por exemplo. Se a voz soa completamente diferente, então por concepção, a pessoa não seria reconhecida como compatível com o cadastro. Em casos extremos como este, o usuário pode ser obrigado a recorrer a outra modalidade biométrica ou meio de autenticação.

Estes são os mesmos tipos de limitações que afetam outras modalidades biométricas. Certa porcentagem da população é incapaz de utilizar dispositivos de impressões digitais, por exemplo, devido a alterações nas mãos por conta de trabalho manual.

É importante utilizar um produto que suporte o enriquecimento do modelo, onde novos modelos de voz são fundidos em modelos anteriores, a fim de se adaptarem às mudanças na voz de um utilizador ao longo do tempo, embora esta mudança seja lenta, normalmente exigindo vários anos para uma mudança significativa. Isso permite a verificação contínua de uma voz que muda com o tempo devido a doença ou idade.

Não. Saber o que é dito é o domínio do reconhecimento da fala. A biometria da voz reconhece as características únicas da fala do usuário.

O ambiente pode ter um impacto na autenticação de voz. Por exemplo, a voz pode ser menos confiável se o nível de voz do usuário não for suficientemente alto em comparação com o ruído de fundo. Num ambiente com muito barulho, a pessoa precisa falar mais alto do que o ruído de fundo, mas isso terá um limite. Da mesma forma, a biometria facial pode não funcionar se a iluminação for inadequada. As raras questões de desempenho devidas a fatores ambientais são abordadas utilizando uma abordagem biométrica multimodal para oferecer um meio de autenticação alternativo.

Sim. Como tal, os sistemas biométricos de voz devem ser implantados com anti-spoofing, também conhecido como “detecção de vivacidade”, para evitar que os fraudadores se façam passar por um usuário real. Os métodos que os fraudadores utilizam incluem gravações de voz, voz alterada por computador, e voz sintética ou deepfake. Os produtos anti-spoofing de voz podem determinar se uma voz pertence a uma pessoa real.

A biometria de voz pode funcionar no canal de telefone ou num canal de microfone para a implantação numa vasta gama de casos de uso, desde o call center a aplicações mobile e aplicativos de mensagem, até dispositivos domésticos inteligentes. Um sistema biométrico de voz moderno deve oferecer às empresas a capacidade de um usuário se inscrever num canal e subsequentemente autenticar em qualquer canal que suporte voz sem necessidade de realizar um novo cadastro.