Cientistas do Google DeepMind estão desenvolvendo uma síntese de voz, um processo que permite a produção artificial de voz humana, por meio do uso da tecnologia de inteligência artificial.
Enquanto as máquinas hoje conseguem escutar a voz humana de uma forma avançada, as respostas fornecidas pelo Google e outras empresas ainda apresentam falhas perceptíveis que podem ser notadas como “robóticas”.
Atualmente a “voz” das máquinas se baseia em fragmentos de dados que combinadas são capazes de formar palavras. Entretanto, essa união pode apresentar sonoridades desiguais e inflexões estranhas.

Para corrigir esse problema, a DeepMind pretende simular o som de 16.000 amostras por segundo com um nível profundo de análise capaz de construir o som a partir de zero.
A abordagem da WaveNet significa que o Google poderia gerar qualquer tipo de fala ou até mesmo música. Você pode ouvir abaixo da qualidade desta nova síntese de voz:
[soundcloud url=”https://api.soundcloud.com/tracks/282146215″ params=”auto_play=false&hide_related=false&show_comments=true&show_user=true&show_reposts=false&visual=true” width=”100%” height=”450″ iframe=”true” /]
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!