Capítulo Quarenta — Definições e Testes
A interface era limpa e delicada, e suas funções não diferiam muito das de outros sistemas. Mexendo de forma despretensiosa, percebia-se que não havia nada de especialmente inovador nas funcionalidades; tudo seguia o padrão, sem causar incômodos, mas também sem surpreender o usuário. Se um pacote de atualização desses fosse disponibilizado na internet, rapidamente se perderia entre tantos outros, quase impossível chamar a atenção de alguém.
Obviamente, tratava-se de uma versão inicial de testes, e não se exigia inovação em cada aspecto funcional; bastava que tudo funcionasse normalmente. O brilho do “Pioneiro” estava em outro lugar.
Deslizando o dedo, abriu as configurações e foi até a opção “Assistente Pessoal de Voz”. Tocou para ativar, e imediatamente a tela se apagou. Quando voltou a se acender, uma linha inteira de instruções apareceu.
“Bem-vindo ao Assistente Pessoal de Voz Pioneiro. Por favor, dê-me um nome.”
“Hum, você vai se chamar Bo.”
“Certo, a partir de agora me chamo Bo. Como devo chamá-lo?”
“Chame-me de Desenvolvedor.”
“Entendido, Desenvolvedor. A palavra de ativação está definida. Agora Bo irá prestar uma série de serviços para você…”
Em poucas frases, qualquer pessoa acostumada a usar assistentes de voz perceberia algo fora do comum. Nos assistentes comuns, mesmo que permitam personalizar a palavra de ativação, seria impossível compreender linguagem natural nesse nível; seria preciso configurar tudo de modo rígido e mecanicista, nada parecido com a simplicidade de um diálogo cotidiano como o que Lu Yuan acabara de fazer.
Simples até parecer absurdo… mas era realmente assim tão simples.
O avanço da tecnologia existe para facilitar a vida das pessoas; quanto mais inteligente for a inteligência artificial, mais fácil deve ser sua configuração, sem exigir tempo e energia excessivos em gravações repetidas.
Contudo, um teste pontual não provava nada. A dificuldade do reconhecimento de voz estava, de um lado, na taxa de amostragem em ambientes complexos e, de outro, na precisão ao identificar diferentes idiomas e dialetos. O primeiro aspecto era facilmente solucionável, mas o segundo ainda era um desafio: há dois anos, a taxa de erro do reconhecimento de voz do Google era de 25%, e hoje caiu para 1/16, mas ainda estava longe do ideal para uma comunicação fluida entre homem e máquina.
Lu Yuan restaurou as configurações e, em seguida, testou usando cantonês, o dialeto de Sichuan, o dialeto de Tianjin, o dialeto de Shandong, inglês, japonês, francês e outras línguas ou variantes regionais. O resultado foi impressionante: exceto por um erro ocasional, a taxa de reconhecimento em longos diálogos atingiu 100%.
Esse resultado era realmente surpreendente. O Google empregou centenas de engenheiros por dois anos e ainda não chegou a esse patamar.
“Bo!”
Com o telefone em modo de espera a uns sete ou oito metros de distância, Lu Yuan chamou suavemente.
Imediatamente, a tela apagada se acendeu, e uma voz feminina suave soou do aparelho: “Desenvolvedor, em que posso ajudar?”
“Me ajude a mandar uma mensagem dizendo que não vou mais hoje à noite.”
Lu Yuan falou em um tom natural, até mesmo propositalmente mais lento. Normalmente, assistentes de voz têm dificuldades com o ritmo da fala: se o usuário fala rápido demais ou devagar demais, o assistente não compreende e responde de maneira confusa, pedindo para repetir a instrução anterior.
Desta vez, mesmo com o ritmo propositalmente pausado, o assistente pessoal reconheceu corretamente o comando, avançando rapidamente para a tela de envio de mensagens. “Desenvolvedor, para quem deseja enviar a mensagem?”
“Muito bem, não precisa mais, apague a mensagem.”
“Ok, Desenvolvedor, a mensagem foi cancelada.”
“Abra a música para mim…”
“Não estou muito bem, escolha uma música que me faça sentir feliz.”
“Pronto, pause a música e veja para mim a previsão do tempo para esta noite…”
Em várias sequências de comandos, o assistente pessoal chamado Bo executou rapidamente e com precisão todas as tarefas, sem apresentar qualquer problema.
O mais impressionante era que todos esses comandos foram dados imediatamente após o anterior, sem a necessidade de ativar novamente o assistente.
Nos assistentes de voz atuais, cada comando precisa ser ativado individualmente; não é possível encadear ordens, e mesmo a assistente da Apple exige que se diga “Ei, Siri” para reativá-la.
Isso significa que, para uso prolongado, o usuário não pode dar comandos seguidos; deve ativar o assistente várias vezes.
No entanto, como Lu Yuan demonstrou, por pelo menos cinco minutos, enquanto a música tocava, ele interrompeu para pedir a previsão do tempo, e o assistente pessoal foi capaz de ignorar o som da música, captar a voz de Lu Yuan com precisão e permanecer alerta o tempo todo, pronto para atender aos comandos a qualquer instante.
Em apenas dez minutos de testes, já era possível perceber que o APA estava muito mais avançado que a versão anterior; poderia, sem dificuldade, ser considerado um produto final, à frente dos modelos BA e R, pronto para chegar ao estágio RAS.
“Bo, o que acha de mim?”
“Desenvolvedor, nestes onze minutos de convivência, acredito que você é uma pessoa gentil.”
“Oh? Por que acha que sou gentil?” Lu Yuan perguntou, divertido.
“Uma pessoa pode ser compreendida através de palavras e gestos. Sua natureza gentil é inegável, tão brilhante quanto a lua na noite. Por favor, não esconda mais quem você é.”
“Bo, você é mesmo interessante.”
“Obrigado pelo elogio, também penso assim.”
Lu Yuan mal podia acreditar; tratava-se apenas de um pequeno programa, funcionando até mesmo offline. Se estivesse conectado à internet, com Sunny processando os dados, certamente seria ainda mais impressionante.
“Sunny, pode elevar o número da versão para BA. Já está bastante completo, quase não há problemas nas funcionalidades.”
Na visão de Lu Yuan, embora ainda houvesse pequenos detalhes a aprimorar na flexibilidade do assistente pessoal, comparado aos concorrentes do mercado, como Orana da Microsoft ou Oono do Google, que ainda eram apenas curiosidades para os usuários, o “Pioneiro” já estava pronto para ser incorporado ao cotidiano, tornando-se um verdadeiro ajudante indispensável.
Sua excelência era evidente. O próximo passo era pensar em como promovê-lo.
“Hmm, talvez seja hora de mudar o nome.”
O nome não pode ser subestimado. Quando se fala em assistente de voz, logo vêm à mente a Cortana da Microsoft ou a Siri da Apple. Essa é a força da marca. Neste mundo de posicionamento, marketing eficiente exige criar imagens mentais poderosas; um nome simples e marcante tem efeito decisivo na promoção de um produto.
“Pioneiro” ou “P-1” poderiam servir como nomes internos, mas como marca seriam negativos para o marketing.
“Que nome seria ideal?”
“Bento? Gugu? Jéssica? Nanda?”
Os olhos de Lu Yuan brilharam: “Já sei, será ‘Coco’. Deixe a voz mais suave e jovem, configurada para uma garota de dezessete anos… Mas, pensando bem, melhor ainda seria transformá-la em uma assistente virtual idol.”
Há um grupo que não pode ser ignorado nesta época: muitos não têm namorada, não conseguem encontrar, ou mesmo não querem procurar, mas esse público possui grande poder de consumo. Na China, Japão e Coreia, esse grupo é gigantesco; conquistar seu coração seria de enorme ajuda para os planos futuros de Lu Yuan.
Além disso, transformar o assistente de voz em uma idol virtual aumentaria a sensação de envolvimento. O ser humano é sensível por natureza. Com o nível de inteligência artificial do “Pioneiro” e uma personalidade de idol, em pouco tempo o usuário criaria hábitos e até dependência.
Se chegasse a esse ponto, o “Pioneiro” se integraria por completo à vida das pessoas, tornando-se um novo tipo de mascote eletrônico.