A cena é conhecida e já foi usada em inúmeras novelas e tantos outros filmes: o executivo em sua sala pega o telefone e fala com a secretária, militarmente postada à porta: “Dona Zuleika, por favor faça uma reserva para sexta-feira à noite para minha esposa e para mim no restaurante Chez D’or, às 20:00.” E lá vai Dona Zuleika cumprir seu dever profissional de cuidar das minudências do chefe.
Corta para 2018, mais precisamente para o dia 08 de maio, na cidade de Mountain View, na Califórnia, e vemos essa cena migrar para algo realmente impressionante. No evento de abertura da I/O, a convenção anual do Google, o presidente da empresa Sundar Pichai mostrou um avanço do assistente digital (que convencionamos chamar de “OK Google” por ser a forma verbal de acionar o referido assistente): a capacidade de realizar chamadas em nome do usuário. O vídeo contido na página do site The Verge (falado em inglês, com legendas em inglês) mostra o assistente, baseado em anos de pesquisa em Inteligência Artificial, marcando um horário em um cabelereiro para sua dona, e em outra instância, tentando fazer uma reserva em um restaurante para seu dono. Em ambos os casos, a dicção, fluência, reação e condução geral da chamada não permitiriam aos funcionários do cabelereiro ou do restaurante identificar que estão, na realidade, conversando com computadores. No caso do restaurante, aliás, podemos dizer que a proficiência na conversação está do lado do assistente do Google, e não do ser humano.
Para fins de avaliação e contraste, observe que os assistentes digitais em funcionamento em nossos celulares e dispositivos domésticos — Siri, Alexa, Cortana e a versão atual do próprio OK Google — estão longe de serem capazes de fazer algo nessa linha. O máximo que consigo é algo na linha de “E aí, Siri? Me lembre de fazer reserva para hoje à noite no restaurante X, às 10:00”. Quando chegar 10:00, receberei uma notificação da Siri me lembrando de fazer a reserva. E isso já é uma mão na roda, diga-se de passagem. Mas não chega nem aos pés da conveniência de delegar algo na linha de “Faça uma reserva para duas pessoas no restaurante X para hoje às 20:00” e só receber uma notificação de que a reserva foi, de fato, feita sem percalços. É a Dona Zuleika residindo em nossos celulares e cada vez mais capaz de cuidar de nossas minudências, apesar de poucos de nós sermos executivos com secretária na porta da sala.
As implicações, obviamente, não param por aí.
Em primeiro lugar, esse tipo de interação já consegue passar o Teste de Turing, pois o sistema consegue se comunicar de maneira inteligente a ponto de poder ser confundido com um ser humano, e isso, por si só, é uma notícia gigante. É claro que ainda estamos longe da realidade proposta em Westworld, com robôs humanoides interagindo com seres humanos (e, no processo, permitindo que despertemos todas as mais violentas e recônditas perversidades de nossa natureza). Mas que é um passo importante nessa direção, não há como negar. A aplicação embrionária do Google abre portas largas para futuras interações de seres humanos com objetos, transpondo para a voz sintetizada (e indistinguível da voz de uma pessoa) algumas situações que hoje só são possíveis por meio de texto escrito. Transpondo essa capacidade para uma residência, podemos ter todo tipo de conveniência à nossa disposição, e muito mais quando pensamos nos deficientes visuais e cidadãos da terceira idade. Automóveis podem lembrar motoristas de problemas mecânicos, caminhos a tomar (de maneira bem mais natural e eficiente que os aparelhos ou aplicativos de GPS dos dias de hoje), e oportunidades nos comércios pelos quais passamos em nossos deslocamentos. Geladeiras podem nos puxar a orelha quando, ao invés de uma fruta, pegamos mais um pedaço de doce para aquela boquinha fora de hora, e por aí vai. O limite será a criatividade, e não a tecnologia.
Mas outras implicações têm o potencial para serem menos positivas, claro. Hoje é trabalhoso, mas não é difícil uma pessoa compor um dicionário fonético com dados de sua própria voz, o que permitiria que usássemos nossas vozes reais para as interações por voz. E aí surge a questão ética de fazer com que o assistente digital se passe por nós. Não dou três anos após a disponibilização dessa solução do Google para que surjam aplicações que se passem por um indivíduo ao telefone e sejam capazes de enganar até mesmo amigos próximos a esse indivíduo.
Mas daí para chegar aos robôs não é um “pulinho”? Não, felizmente. A parte da solução que fica em nosso celular é responsável por algo na linha de 0,0001% do processamento necessário para uma das chamadas telefônicas dadas de exemplo no I/O. Os demais 99,9999% são realizados pelo equivalente a um hangar de Boeing 747 abarrotado de computadores dedicados à tarefa de fazer a conversa fluir da maneira mais natural possível. Até conseguirmos expandir a capacidade de conversação para além da trivialidade de marcar um compromisso de agenda, e miniaturizar tudo para caber no equivalente cibernético de uma caixa craniana, vai uma distância considerável.
Mas, para aqueles que se interessam pelo intelecto de Dona Zuleika, e não por seus dotes físicos, as possibilidades estão bem mais próximas do que muitos imaginam.
Comments: no replies