O Alexa está instalado em mais de 100 milhões de dispositivos em todo o mundo, adquirindo bilhões de consultas de usuários no processo. Como todos os assistentes digitais, o Alexa conta com modelos de dados para oferecer melhores respostas, mas parece que a Amazon também ajudou o assistente digital na forma de críticas humanas. Uma investigação da Bloomberg revelou que a Amazon possui uma equipe global que transcreve e anona as gravações do Alexa de todo o mundo para "eliminar lacunas no entendimento do discurso humano da Alexa" e permitir ao assistente fornecer melhores respostas às suas perguntas.
A publicação descobriu que a Amazon emprega milhares de pessoas em todo o mundo - tanto contratadas quanto em período integral - para revisar as gravações do Alexa, com equipes espalhadas por Boston, Costa Rica, Índia e Romênia. De acordo com uma fonte não identificada, cada revisor analisa mais de 1.000 clipes de áudio em um turno de nove horas, anotando-os e enviando-os de volta ao sistema para melhorar as respostas do Alexa. Partida Bloomberg:
Um trabalhador em Boston disse que extraiu dados de voz acumulados para declarações específicas como "Taylor Swift" e os anotou para indicar que o pesquisador era o artista musical.
Ocasionalmente, os ouvintes pegam coisas que os proprietários de eco provavelmente preferem ficar em sigilo: uma mulher cantando mal na tecla do chuveiro, digamos, ou uma criança gritando por socorro. As equipes usam salas de bate-papo internas para compartilhar arquivos quando precisam de ajuda para analisar uma palavra confusa - ou encontrar uma gravação divertida.
A publicação também descobriu que os funcionários se deparam com gravações de natureza perturbadora:
Às vezes, ouvem gravações que consideram perturbadoras ou possivelmente criminosas. Dois dos trabalhadores disseram ter recebido o que acreditam ser um abuso sexual. Quando algo assim acontece, eles podem compartilhar a experiência na sala de bate-papo interna como uma maneira de aliviar o estresse.
A Amazon diz que possui procedimentos para que os trabalhadores sigam quando ouvem algo angustiante, mas dois funcionários da Romênia disseram que, depois de solicitar orientações para esses casos, disseram a eles que não era tarefa da Amazon interferir.
As gravações não têm o nome ou endereço completo de um usuário, mas incluem o primeiro nome do usuário, um número de conta e o número de série do dispositivo. A Amazon mencionou anteriormente que depende do processamento de linguagem natural para treinar o Alexa, mas admitiu à Bloomberg que usa um elemento humano para anotar uma "pequena amostra de gravações de voz do Alexa:"
Levamos a sério a segurança e a privacidade das informações pessoais de nossos clientes. Apenas anotamos uma amostra extremamente pequena de gravações de voz Alexa, a fim de melhorar a experiência do cliente. Por exemplo, essas informações nos ajudam a treinar nossos sistemas de reconhecimento de fala e entendimento de linguagem natural, para que o Alexa entenda melhor suas solicitações e garanta que o serviço funcione bem para todos.
Temos rigorosas salvaguardas técnicas e operacionais e temos uma política de tolerância zero para o abuso do nosso sistema. Os funcionários não têm acesso direto às informações que podem identificar a pessoa ou a conta como parte desse fluxo de trabalho. Todas as informações são tratadas com alta confidencialidade e usamos autenticação multifator para restringir o acesso, criptografia de serviço e auditorias do nosso ambiente de controle para protegê-lo.
Não é apenas a Amazon que está recorrendo aos ajudantes humanos para desenvolver seu assistente digital. A Bloomberg descobriu que a Apple também possui uma equipe humana que verifica se a interpretação das solicitações da Siri corresponde ao que foi solicitado pelos usuários. O Google tem revisores que treinam o Assistente, mas os clipes não têm nenhuma informação de identificação pessoal e o áudio em si é distorcido para impedir qualquer identificação.